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尽管 汇编 语言 也 是 一 种 计算 机 语言 ， 但 却 是 与 众 不 同 的 ， 与 它 的 
同类 们 格格 不 入 。 处 理 费 的 工作 古 执 行 指令 并 获得 结果 ， 而 为 了 和 车 台 
处 理 夫 ， 汇 编 语 言 为 每 一 种 指令 提供 了 简单 好 记 、 易 于 书写 的 符号 化 
表示 形式 。 

一 二 以 来 ， 人 们 对 于 汇编 语言 的 认识 和 评价 可 以 分 为 两 种 ， 一 种 
是 帝 得 它 非 名 简单 ， 态 一 种 是 和 贫 得 它 学 习 起 来 非 钟 困难 。 

你 认为 我 会 赞同 哪 一 种 ?说 汇编 语言 难 学 ， 这 没有 道理 。 学 习 任 
何 一 门 计 算 机 语言 ， 部 圾 要 一 些 数 制 和 数 制 转换 的 知识 ， 也 需要 大 体 
上 生得 计算 机 是 怎么 运作 的 。 在 这 个 前 提 下 ， 汇 编 语 言 是 最 贴近 硬件 
实体 的 ， 也 是 最 自然 和 最 朴 系 的 。 最 朴素 的 东西 反而 最 难 掌握 ， 这 实 
在 说 不 过 去 。 因 此 ， 原 因 很 可 能 出 在 我 们 的 教科 书 上 ， 那 些 一 上 来 就 
捅 一 大 堆 寻 址 方式 的 书 ， 人 往往 以 最 快 的 速度 打败 了 本 来 沿 悄 局 郧 的 初 
学 者 。 

但 是 ， 说 汇编 语言 好 学 ， 也 同 梓 有些 死 雇 。 据 我 的 观察 ， 很 多 人 
掌握 了 厂 干 计算 机 指令 ， 会 编写 一 个 从 键盘 输入 数据 ， 然 后 进行 加 减 
乘除 或 者 归 关 排序 的 程序 后 ， 融 认为 目 己 学 握 了 汇编 语言 。 还 有 ， 有 下 
到 现在 ， 我 还 经 名 在 网 上 看 到 学 生 们 使 用 DOS 中 断 编写 程序 ， 他 们 讨 
论 的 也 大 多 是 实 模式 ， 而 非 32 位 或 者 64 位 保护 模式 。 他 们 知道 如 何 
编译 源 程序 ， 也 知道 在 命令 行 输入 文件 名 ,程序 束 能 运行 了 ; 叉 或 者 
使 用 一 个 中 断 ， 束 能 显示 字符 。 至 于 这 期 间 发 生 了 什么 ， 程 序 是 如 何 
加 载 到 内 存 中 的 ， 又 是 怎么 重 定位 的 ， 似 乎 从 来 不 关 汇 编 语言 的 事 。 
这 样 做 的 结果 ， 就 是 让 人 以 为 汇编 语言 不 过 如 此 ， 而 且 非 第 枯燥 。 

很 难说 我 已 经 掌握 了 汇编 语言 的 要 义 。 但 至 少 我 知道 ， 尺 管 汇 编 
语言 不 适合 用 来 编写 大 型 程序 ， 但 它 对 于 理解 计算 机 原理 很 有 帮助 ， 
特别 是 处 理 硕 的 工作 原理 和 运行 机 制 。 瓯 算是 为 了 这 个 目的 ， 也 应 访 
让 汇编 语言 回归 它 的 本 位 ， 那 就 是 访问 和 控制 硬件 (包括 处 理 器 〉， 
而 不 仅仅 古 编 瑟 程 序 ， 输 入 几 个 数学 ， 找 出 正 数 有 几 个 、 负 数 有 几 
个 ， 大 于 30 的 有 几 个 。 


事实 上 ， 汇 编 语 言 对 学 习 和 理解 高 级 语言 ， 比 如 C 语言 ， 也 有 极 
大 的 帮助 。 老 教授 琢磨 了 好 几 天 ， 终 于 想到 一 个 好 的 比喻 来 帮助 学 生 
理解 什么 是 指针 ， 实 际 上 ， 这 对 于 懂得 汇编 语言 的 学 生来 说 ， 根 本 整 
不 算 个 事 儿 ， 并 因此 能 够 使 老 教 授 省 下 时 间 来 喝 茶 。 

在 这 本 书 之 前 ， 我 也 写 过 《和 穿越 计算 机 的 迷 筋 》 一 书 。 它 们 是 一 
个 系列 ， 没 有 基础 的 读者 可 以 先 看 那 本 书 ， 打 一 点 计算 机 原理 的 基础 
于 有 米 尝 习 江 编 语言 

在 计划 写 这 本 书 的 时 候 ， 我 就 给 自己 画 了 几 条 线 。 首 先 不 能 走 老 
路 ， 一 上 来 束 讲 指令 、 寻 址 方式 ， 而 是 采用 任务 驱动 的 方式 来 号 ， 每 
一 章 都 要 做 点 事情 ， 最 好 是 比较 有 趣 ， 有 了 吸引 力 。 在 解决 问题 的 过 程 
中 ， 不 断 地 引入 新 指令 ， 并 进行 讲解 。 一 句 话 ， 我 希望 是 润 物 细 无 声 
式 的 ; 其次， 汇编 语言 和 人 硬件 并 举 ， 完 全 抛弃 BIOS 中 断 和 DOS 中 
断 ， 直 接 访问 人 硬件， 发 挥 汇编 语 言 的 长 处 ， 因 为 这 才 是 我 们 学 习 汇 编 
语言 的 目的 。 也 只 有 这 样 ， 读 者 才能 深刻 体会 到 汇编 语言 的 妙 处 。 

王晓波 和 湖北 经 济 学 院 的 余 洁 共同 参与 了 本 书 的 创作 。 

本 书 主要 讲述 INTEL x86 处 理 器 的 16 位 实 模式 、32 位 保护 模 
式 ， 至 于 虚拟 8086 模式 ， 则 是 为 了 兼容 传统 的 8086 程序 ， 现 在 看 来 
己 经 完全 过 时 ， 不 再 进行 讲述 。 本 书 的 特色 之 一 是 提供 了 大 量 典 型 的 
源 代 码 ， 这 些 代 人 码 以 及 相配 套 的 工具 程序 可 以 到 书 中 指定 的 网 站 ， 或 
者 电子 工业 出 版 社 华 信 教育 资源 网 搜索 下 载 。 

很 多 读者 在 读书 的 时 候 会 遇 到 这 种 情况 : 一 开始 读 得 很 快 ， 一 口 
气 读 了 好 几 章 。 随 着 内 容 的 深入 ， 学 习 越 来 越 吃力 ， 不 得 不 频繁 回 到 
前 面 重 新 学 习 已 经 讲 过 的 内 容 ， 这 就 是 因为 前 面 的 知识 没有 完全 掌 
握 。 为 此 ， 本 书 每 一 章 都 设 有 检测 点 ， 读 者 应 当 在 通过 检测 点 之 后 再 
继续 往 后 阅读 。 

本 书 原 来 有 18 章 ， 后 来 考虑 到 实 模式 的 内 容 过 多 ， 而 去 择 了 一 
瘟 。 这 一 章 的 标题 是 《聆听 数字 的 声音 》， 讲 述 如 何 通过 直接 访问 和 
控制 Sound Blaster 16 声卡 来 播放 声音 ， 感 兴趣 的 朋友 可 以 从 下 载 的 
配 书 文件 包 中 找到 这 部 分 内 容 。 

在 本 书 的 写作 和 出 版 过 程 中 ， 长 春 电 视 台 台 长 王志强 ， 副 台 长 周 
武 军 和 技术 部 主任 刘 贵 先后 对 本 书 给 予 了 关心 和 支持 ， 在 此 表示 衷心 


的 感谢 。 

好 友 王 南洋 、 桑 国 伟 、 刘 维和 惠 、 藉 胜 友 、 邢 海龙 、 万 利 、 李 文 心 
等 负责 了 本 书 的 一 部 分 校对 工作 ;， 好 友 周 卫 平 帮 我 验证 配 书 代 人 码 是 个 
能 在 他 的 机 器 上 正常 工作 ， 在 这 里 同 他 们 表示 感谢 ， 同 时 也 谢谢 所 有 
关心 和 文 持 本 书 的 朋友 们 。 

感谢 我 的 母 杀 、 我 的 妻子 和 我 的 女儿 ， 她 们 是 我 的 精神 文 柱 ， 是 
我 努力 创作 这 本 书 的 动力 来 源 。 

在 阅读 本 书 的 过 程 中 ， 如 果 有 任何 问题 ， 可 以 往 电 子 邮 件 地 址 
leechung@126.com 给 我 写 信 ; 要 了 解 其 他 更 多 的 情况 ， 请 访问 我 的 


博客 : http://blog.163.com/leechung@126。 
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第 1 部 分 “预备 知识 


了 解数 制 的 基本 知识 和 数 制 转换 的 方法 。 

了 解 8086 处 理 器 的 结构 和 工作 方式 ， 初 步 认识 所 谓 的 针对 处 理 器 
编程 ， 是 针对 处 理 器 的 哪些 部 件 和 哪些 方面 进行 的 ， 理 解 分 段 的 原 
理 。 

了 解 什么 是 汇编 语言 ， 以 及 如 何 书写 、 编 译 汇编 语言 源 程序 ， 党 
握 在 虚拟 机 上 运行 程序 的 方法 。 


第 1 章 “ 十 六 进 制 计数 法 


电子 计算 机 ， 顾 名 思 义 ， 束 是 计算 的 机 右 。 因 此 ， 和 学 习 汇 编 语言 ， 
束 不 可 如 倪 地 要 和 数字 打交道 。 在 这 个 过 程 中 ， 我 们 要 用 到 三 种 数 制 : 
十 进 制 ( 这 是 我 们 再 熟悉 不 过 的 ) 、 二 进 制 和 十 六 进 制 。 本 章 的 目标 
是 : 

1. 熟 炙 后 两 种 数 制 ， 了 解 这 两 种 数 制 的 计数 特 后 。 

2. 能 够 在 这 三 种 数 制 之 间 熟 练 地 进行 转换 ， 特 别 是 看 到 一 个 二 进 制 
数 时 ， 能 够 口算 出 它 对 应 的 十 六 进 制 数 ， 反 之 处 然 。 

3. 对 于 0 一 15 之 间 的 任何 一 个 十 进 制 数 ， 能 够 立即 说 出 它 对 应 的 二 
进 制 数 和 十 六 进 制 数 。 


1.1 ”二进制 计数 法 回顾 
1.1.1 关于 二 进 制 计数 法 


在 《穿越 计算 机 的 迷 稚 》 那 本 书 里 我 们 已 经 知道 ， 计 算 机 也 是 一 从 
机 项 ， 唯 一 不 同 的 地 方 在 于 它 能 计算 数学 题 ， 且 具有 揭 辑 判断 能 


与 此 同时 ， 我 们 也 已 经 在 那 本 书 里 学 到 ， 机 器 在 做 数学 题 的 时 候 ， 
也 面临 着 一 个 如 何 表示 数字 的 问题 ， 比 如 你 采用 什么 办 法 来 将 加 数 和 被 
加 数 送 到 机 器 里 。 

同样 是 在 那 本 书 里 ， 我 们 揭晓 了 管 案 ， 那 束 是 用 高 、 低 两 种 电 平 的 
组 合 来 表示 数字 。 如 图 1-1 所 示 ， 参 与 计算 的 数字 通过 电线 送 往 计算 机 
右 ， 高 电 平 被 认为 是 “人 ， 低 电 平 被 认为 是 "0"”， 这 样 就 形成 了 一 个 序列 
“11111010”"， 这 就 是 一 个 二 进 制 数 ， 在 数值 上 等 于 我 们 所 熟知 的 二 白 五 ， 
换 句 话说 ， 等 于 十 进 制 数 250。 
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图 1-1 在 计算 机 里 ， 二 进 制 数 学 对 应 看 融 低 电 平 的 组 合 


从 数学 的 角度 来 看 ， 二 进 制 计数 法 是 现代 主流 计算 机 的 基础 。 一 方 
面 ， 它 简化 了 硬件 设计 ， 因 为 它 只 有 两 个 符号 “0? 和 "人 ， 要 得 到 它们 ， 可 
以 用 最 少 的 电路 元 件 来 接 通 或 者 关 断 电路 束 行 了 ; 男 一 方面 ， 二 进 制 数 
与 我 们 熟悉 的 十 进 制 数 之 间 有 着 一 对 一 的 关系 ， 任 何 一 个 十 进 制 数 都 对 
应 着 一 个 二 进 制 数 ， 不 管 它 有 多 大 。 比 如 ， 十 进 制 数 5， 它 所 对 应 的 二 进 
制 数 是 101， 而 十 进 制 数 5785478965147 则 对 应 着 一 长 串 “0” 和 “1” 的 组 
合 ， 即 1010100001100001001011010110010011110011011。 


组 成 二 进 制 数 的 每 一 个 数位 ， 称 为 一 个 比特 〈bit) ， 而 一 个 二 进 制 
数 也 可 以 看 成 是 一 个 比特 串 。 很 明显 ， 它 的 数值 越 大 ， 这 个 比特 串 束 越 
长 ， 这 是 二 进 制 计数 法 不 好 的 一 面 。 


1.1.2 ”二进制 到 十 进 制 的 转换 


每 一 种 计数 法 都 有 上 自己 的 符号 〈 数 符 ) 。 比 如 ， 十 进 制 有 0、1、2、 
3、4、5、6、7、8、9 这 十 个 符号 ; 二 进 制 呢 ， 则 只 有 0、1 这 两 个 符 
号 。 这 些 数字 符号 的 个 数 称 为 基数 。 也 就 是 说 ， 十 进 制 有 10 个 基数 ， 而 
二 进 制 只 有 两 个 。 

二 进 制 和 十 进 制 都 是 进位 计数 法 。 进 位 计数 法 的 一 个 特点 是 ， 符 号 
的 值 和 它 在 这 个 数 中 所 处 的 位 置 有 关 。 比 如 十 进 制 数 356， 数 字 6 处 在 个 
位 上 ， 所 以 是 “6 个 ”5 处 在 十 位 上 ， 所 以 是 “50”; 3 处 在 百 位 上 ， 所 以 
是 “300”。 即 : 

百 位 3、 十 位 5、 个 位 6 二 3x10? 十 5x101 十 6x10° 一 356 

这 就 是 说 ， 由 于 所 处 的 位 置 不 同 ， 每 个 数位 都 有 一 个 不 同 的 放大 倍 
数 ， 这 称 为 “ 权 ”"。 每 个 数位 的 权 是 这 样 计算 的 (这 里 仪 讨论 整数 ) : 从 石 
往 左 开始 ， 以 基数 为 底 ， 指 数 从 0 开始 递增 的 蝴 。 正 如 上 面 的 公式 所 清楚 
表明 的 那样 ，“6” 在 最 右边 ， 所 以 它 的 权 是 以 10 为 底 ， 指 数 为 0 的 早 100 
; 而 3 呢 ， 它 的 权 则 是 以 10 为 底 ， 指 数 为 2 的 祖 102 。 

上 面 的 算式 是 把 十 进 制 数 "翻译 "成 十 进 制 数 。 从 十 进 制 数 又 算 回 到 十 
进 制 数 ， 这 看 起 来 有 些 可 笑 ， 注 意 这 个 公式 是 可 以 推广 的 ， 可 以 用 它 来 
将 二 进 制 数 转 换 成 十 进 制 数 。 

比如 一 个 二 进 制 数 10110001， 它 的 基数 是 2， 所 以 要 这 样 来 计算 与 
它 等 值 的 十 进 制 数 : 
10110001B 王 1x27 十 0x26 十 1x25 十 1x24 十 0x23 十 0x22 十 0x21 十 1x2 0 

一 177D 

在 上 面 的 公式 里 ，10110001B 里 的 “B” 表 示 这 是 一 个 二 进 制 数 ，"“D” 
则 表示 177 是 个 十 进 制 数 。“B” 和 “D” 分 别 是 英语 单词 Binary 和 Decimal 的 
头 一 个 字母 ， 这 两 个 单词 分 别 表 示 二 进位 和 十 进位 的 意思 。 

检测 点 1.1 


将 下 列 二 进 制 数 转 换 成 十 进 制 数 : 
1101、1111、1001110、11111111、10000000、1101101100011011 


1.1.3 “十进制 到 二 进 制 的 转换 


为 了 将 一 个 十 进 制 数 转 换 成 二 进 制 数 ， 可 以 采用 将 它 不 俘 地 除 以 二 
进 制 的 基数 2， 下 到 了 商 为 0， 然 后 将 每 一 步 得 到 的 余数 串 起 来 即 可 。 如 图 
1-2 所 示 ， 如 果 要 将 十 进 制 数 26 转换 成 二 进 制 数 11010， 那 么 可 粹 用 如 下 
方法 : 


2 | 26 a We - 
| 余 ! -1 
| rn 余 0 ----------- 
2 | 3 -1 Sn \ | 
2 | | 余 1 ee. ' 
YY YY Y 
f 有 工 0 


图 1-2 ”将 十 进 制 数 26 转换 成 二 进 制 数 
第 1 步 ， 将 26 除 以 2， 商 为 13， 余 数 为 0; 
第 2 步 ， 用 13 除 以 2， 商 为 6， 余 数 为 1; 
第 3 步 ， 用 6 除 以 2， 商 为 3， 余 数 为 0; 
第 4 步 ， 用 3 除 以 2， 商 为 1， 余 数 为 1; 
第 5 步 ， 用 1 除 以 2， 商 为 0， 余 数 为 1， 结 束 。 


然后 ， 从 下 往 上 ， 将 每 一 步 得 到 的 余数 串 起 来 ， 从 左 往 右 书 写 ， 束 
是 我 们 所 要 转换 的 二 进 制 数 。 


检测 点 1.2 
将 下 列 十 进 制 数 转换 成 二 进 制 数 : 
8、10、12、15、25、64、100、255、1000、65535、1048576 


1.2 十 六 进 制 计 数 法 


1.2.1 十 六 进 制 计数 法 的 原理 


二 进 制 数 和 计算 机 电路 有 着 近乎 直观 的 联系 。 电 路 的 状态 ， 可 以 用 
二 进 制 数 来 直观 地 拉 述 ， 而 一 个 二 进 制 数 ， 也 容易 使 我 们 仿佛 观察 到 了 
每 根 电线 上 的 电 平 变化 。 所 以 ， 我 们 才 形 象 地 说， 二 进 制 是 计算 机 的 官 
方 语 言 。 

即使 是 在 平时 的 学 习 和 研究 中 ， 使 用 二 进 制 也 是 必需 的 。 一 个 数字 
电路 输入 什么 ， 输 出 什么 ， 电 路 的 状态 变 了 ， 是 哪 一 位 肥 生 了 变化 ， 研 
完 这 些 ， 肯 定 要 精确 到 每 一 个 比特 。 这 个 时 候 ， 采 用 二 进 制 是 最 直观 
的 。 


但 是 ， 二 进 制 也 有 它 的 缺点 。 眼 下 看 来 ， 它 最 主要 的 缺点 就 是 写 起 
来 太 长 ， 一 点 也 不 方便 。 为 此 ， 人 们 发 明了 十 六 进 制 计 数 法 。 至 于 为 什 
么 要 发 明 另 外 一 父 计 数 方法 ， 而 不 是 依旧 采用 我 们 熟悉 的 十 进 制 ， 下 面 
束 要 为 大 家 解释 。 

一 旦 知道 二 进 制 有 两 个 数 符 “0”" 和 “1”， 十 进 制 有 十 个 数 符 “0” 到 “9”， 
那么 我 们 束 会 很 卓然 地 认为 十 六 进 制 一 定 有 16 个 数 从 。 

一 所 没 错 ， 完 全 正确 。 这 16 个 数 从 分 别 是 0、1、2、3、4、5、6、 
7、8、9、A、B、C、D、E、F。 

你 可 能 会 觉得 惊讶 ， 字 母 怎 么 可 以 当做 数字 来 用 ? 这 样 的 话 ， 那 些 
熟悉 的 英语 单词 ， 像 Face (〈 脸 ) 、Bad ( 坏 的 ) 、Bed ( 床 ) 就 都 成 了 
数 。 

这 又 有 什么 奇怪 的 ?你 觉得 “0”"、“5”、“9” 是 数字 ， 而 “A”"、"“B” 不 是 数 
字 ， 这 是 因为 你 已 经 从 小 习惯 了 这 种 做 法 。 

对 于 目 然 数 里 的 前 10 个 ， 十 进 制 和 十 六 进 制 的 表示 方法 古 一 致 的 。 
但 是 ，9 之 后 的 数 ， 两 者 的 表示 方法 束 大 相 径 许 了， 如 表 1-1 所 示 。 


表 1-1 部 分 十 进 制 数 和 十 六 进 制 数 对 照 表 


十 六 进 制 数 十 进 制 数 十 六 进 制 数 





很 显然 ， 一旦 芭 个 数位 增加 a 到 9 之 后 ， 下 一 次 ， 它 将 变 成 A， 而 不 是 
疝 前 进位 ， 因为 这 里 是 着 16 才 进 位 的 。 进 位 只 友 生 在 茶 个 数位 原先 是 F 
的 情况 下 ， 比 如 1F， 它 加 一 后 将 会 变 成 20。 


1.2.2 ”十 六 进 制 到 十 进 制 的 转换 
要 把 一 个 十 六 进 制 数 转 换 成 我 们 熟悉 的 十 进 制 数 ， 可 以 采用 和 前 面 


一 样 的 方法 。 只 不 过 ， 计 算 各 个 数位 的 权时 ， 寡 的 底数 是 16。 比 如 将 十 
六 进 制 数 125 转换 成 十 进 制 数 的 方法 如 下 : 


125H 二 1x16“ 十 2x16'" 十 5x16? 二 293D 


上 式 里 ，125 后 面 的 "H? 用 于 表明 这 是 一 个 十 六 进 制 数 ， 现 语 单 
词 Hexadecimal 的 头 一 个 字母 ， 这 个 单词 的 意思 是 十 六 进 制 。 
检测 点 1.3 


将 下 列 十 六 进 制 数 转换 成 十 进 制 数 : 


8、A、B、C、D、E、F、10、1F、6CD、3FE、FFC、FFFF 


1.2.3 “十进制 到 十 六 进 制 的 转换 

如 图 1-3 所 示 ， 相 应 地 ， 要 把 一 个 十 进 制 数 转换 成 十 六 进 制 数 ， 则 可 
以 采取 不 停 地 除 以 16 并 取 其 余数 的 策略 。 

第 1 次 ， 将 293 除 以 16， 障 为 18， 余 5; 

第 2 次 ， 用 18 除 以 16， 商 为 1， 余 2; 

第 3 次 ， 再 用 1 除 以 16， 商 为 0， 余 1， 结 束 。 

然后 ， 从 下 往 上 ， 将 每 次 的 余数 1、2、5 列 出 来 ， 得 到 125， 这 就 是 
所 要 的 结果 。 


16 ne on ri rt a oa 
16 | 18  --------------- 余 2 ------------= 

16 | 1 -------------- A 省 

0 Y YY 

1 槛 和 


图 1-3 ”将 十 进 制 数 293 转换 成 十 六 进 制 数 


检测 点 1.4 
将 下 列 十 进 制 数 转 换 成 十 六 进 制 数 : 
8、10、12、15、25、64、100、255、1000、65535、1048576 


1.2.4 ”为 什么 需要 十 六 进 制 


为 什么 我 们 要 友 明 十 六 进 制 计 数 法 ? 为 什么 我 们 要 学 习 它 ? 

提出 这 样 的 问题 ， 在 我 看 来 很 有 有 有趣， 也 很 有 意义 ， 但 似乎 从 来 没有 
人 在 书 上 正面 回答 过 。 这 样 一 来 ， 可 怜 的 学 子 们 只 能 在 和 坚 握 了 十 六 进 制 
右 干 年 之 后 ， 在 未 一 天 里 目 己 悦 然 六 悟 。 

为 了 搞 消 苞 这 个 问题 ， 我 们 不 妨 来 列 张 表 〈 表 1-2， ， 看 看 十 进 制 
数 、 二 进 制 数 和 十 六 进 制 数 乙 则 ， 都 有 些 什 么 有 趣 的 规律 和 特点 。 


表 1-2 ”部 分 十 进 制 数 、 二 进 制 数 和 十 六 进 制 数 对 照 表 


vv lwmw 和 | ，lw 和 ho 
mwl hnwhmh。 
ah lwlmwl 


wh 和 wm yy 





在 上 面 这 张 表 里 〈( 表 1-2) ， 每 一 个 二 进 制 数 在 排 厂 的 时 候 ， 都 经 过 
了 "艺术 加 工 ”， 全 都 以 4 比特 为 一 组 的 形式 出 现 。 不 足 4 比特 的 ， 前 面 都 
额外 加 了 "0”， 比 如 10， 被 写成 0010 的 形式 。 就 像 十 进 制 数 一 样 ， 在 一 个 
二 进 制 数 的 前 面 加 多 少 个 零 ， 都 不 会 改变 它 的 值 。 

注意 观察 这 张 表 并 开动 脑子 ，4 比特 的 二 进 制 数 ， 可 以 表示 的 数 是 
0000 到 1111， 也 就 是 十 进 制 的 0 一 15， 这 正好 对 应 于 十 六 进 制 的 0 一 F。 

在 这 个 时 候 ， 如 果 将 它们 都 各 自 加 1， 那 么 ， 下 一 个 二 进 制 数 是 0001 
0000， 与 此 同时 ， 它 对 应 的 十 六 进 制 数 则 是 10， 你 会 发 现 ， 它 们 有 着 如 
图 1-4〈 左 边 ) 所 示 的 奇妙 对 应 关系 。 


二 进 制 数 ”0001 ”0000 二 进 制 数 1100 0011 


十 六 进 制 数 十 六 进 制 数 
图 1-4 十 六 进 制 的 每 一 位 与 二 进 制 数 每 4 比特 为 一 组 的 对 应 关系 


再 比如 图 1-4( 右 边 ) 中 的 二 进 制 数 1100 0011， 它 与 等 值 的 十 六 进 
制 数 C3 也 有 着 相同 的 对 应 天 系 。 

也 就 是 说 ， 如 果 将 一 个 二 进 制 数 从 右 往 左 ， 分 成 4 比特 为 一 组 的 形 
式 ， 分 别 将 每 一 组 的 值 转 换 成 十 六 进 制 数 ， 就 可 以 得 到 这 个 二 进 制 数 所 
对 应 的 十 六 进 制 数 。 

这 样 一 来 ， 如 果 我 们 稍 加 努力 ， 将 0~F 这 16 个 数 所 对 应 的 二 进 制 数 
背 熟 ， 并 能 换算 自如 的 话 ， 那 么 ， 当 我 们 看 到 一 个 十 六 进 制 数 3F8 时 ， 


我 们 就 知道 ， 因 为 3 对 应 的 二 进 制 数 为 0011，F 对 应 的 二 进 制 数 是 1111 ， 
8 对 应 的 二 进 制 数 是 1000， 所 以 3F8H= 二 0011 1111 1000B。 


同 理 ， 如 果 一 个 二 进 制 数 是 1101 0010 0101 0001， 那 么 ， 将 它们 按 
4 比特 为 一 组 ， 分 别 换 算 成 十 六 进 制 数 ， 就 得 到 了 D251。 


正如 前 面 所 说 的 ， 从 事 计 算 机 的 学 习 和 研究 〈 包 括 咀 们 马上 束 要 进 
行 的 汇编 语言 程序 设计 ) ， 不 可 避免 地 要 与 二 进 制 数 打交道 ， 而 且 有 时 
还 必须 针对 其 中 革 些 比特 进行 特殊 处 理 。 这 个 时 候 ， 如 果 想 保留 二 进 制 
数 的 直观 性 ， 同 时 还 要 求 写 起 来 简短 ， 十 六 进 制 数 是 最 好 的 选择 。 

检测 点 1.5 

1. 将 下 列 十 六 进 制 数 转换 成 二 进 制 数 : 

3、A、C、F、20、3F、2FE、FFFF、9FC05D、7CCFFEFF 

2. 快速 说 出 以 下 十 进 制 数 所 对 应 的 二 进 制 数 和 十 六 进 制 数 : 

1、3、5、7、9、11、13、15、0、2、4、6、8、10、12、14 


1.3 ”使 用 Windows 计算 器 方便 你 的 学 习 
过 程 


和 十 进 制 数 一 样 ， 二 进 制 数 和 十 六 进 制 数 也 可 以 进行 加 、 减 、 乘 、 
除 运算 。 比 如 ， 两 个 十 六 进 制 数 F 和 A 相 乘 ， 结 果 是 十 六 进 制 数 96。 从 
十 进 制 的 角度 来 看 这 个 计算 过 程 ， 就 是 两 个 十 进 制 数 15 和 10 相生， 结 
为 150。 

在 学 习 汇 编 语言 程序 设计 的 过 程 中 ， 出 于 解决 实际 问题 的 需要 ， 经 
常 要 在 编写 程序 时 做 一 些 计 算 工 作 。 十 进 制 就 不 说 了 ， 我 们 都 很 熟悉 ， 
计算 起 来 芍 轻 就 熟 。 但 是 ， 如 果 是 几 个 二 进 制 数 进行 加 减 乘除 ， 或 者 几 
个 十 六 进 制 数 加 减 乘 除 ， 就 很 困难 了 。 想 想 看 ， 为 了 做 十 进 制 滋 法 ， 我 
们 要 背 九 九 乘 法 口诀 。 而 十 六 进 制 有 16 个 基数 ， 它 的 乘法 口诀 承 更 多 
了 。 

这 本 书 的 目的 不 是 教会 你 十 六 进 制 四 则 运算 的 方法 和 步 又， 不 是 这 
样 的 。 相 反 ， 我 希望 你 能 借助 于 一 些 工 具 来 快速 得 到 计算 结果 ， 从 而 把 
更 多 的 精力 放 到 学 习 汇编 语言 上 。 

不 是 所 有 知识 都 应 当 放 在 脑子 里 ， 要 善于 利用 工具 ! 

为 了 将 较 大 的 数 转换 成 不 同 的 数 制 ， 或 者 进行 某 种 数 制 的 四 则 运 
算 ， 可 以 使 用 Windows 计算 器 。 这 是 一 个 小 软件 ， 每 个 版 本 的 Windows 
操作 系统 都 有 ， 你 应 该 很 熟悉 ， 其 界面 如 图 1-5 所 示 。 注 意 ， 如 果 该 程序 
运行 后 的 界面 与 此 不 同 ， 则 可 以 通过 选择 菜单 “查看 ”->“ 程 序 员 ” 进 行 更 
改 。 
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图 1-5 ”Windows 计算 器 


计算 旨 软 件 的 使 用 方法 并 不 复杂 ， 只 需 和 加 练习 即 可 午 握 。 比 如 ， 
选择 捍 选 钮 “十 六 进 制 "， 然 后 输入 一 个 十 六 进 制 数 。 此 时 ， 如 果 你 再 选择 
持 选 钮 和 十进制”， 则 刚才 输入 的 内 容 束 会 立即 变 成 十 进 制 的 形式 ， 这 束 古 
进行 数 制 转换 的 一 个 例子 。 

检测 点 1.6 

1. 用 计算 如 程序 将 FFCH 转换 成 十 进 制 数 和 二 进 制 数 ; 


2. 用 计算 故 程 序 计 算 FFCH 乘 以 27C0H 的 结果 ， 并 转换 成 二 进 制 
数 。 


本 章 习 题 


1. 口算 : 

5H=__D 12D=__hH 

0CH= _D= _B OAH= _D= 
8D=__H= _B 

OBH= _D= _B OEH= _D= 


10H= D= 8B 
2. 口算 : 


10010B= H 15H= B 8FH= B 


111111111B= _H 


200H= _B 


第 2 章 ”处理 器 、 内 存 和 指令 


鉴于 汇编 语言 和 处 理 器 之 间 的 紧密 关系 ， 学 习 汇 编 语言 的 过 程 ， 实 
际 上 也 是 洞悉 处 理 器 内 部 构造 和 工作 方式 的 过 程 。 在 本 章 中 ， 我 们 要 借 
助 于 一 款 早 已 淘汰 的 处 理 器 INTEL8086 来 了 解 处 理 器 、 内 存 和 指令 这 三 
者 之 间 的 关系 。 不 要 小 看 这 款 处 理 器 ， 它 是 整个 INTEL x86 处 理 器 家 族 
的 起 点 和 基础 。 本 章 的 目标 是 : 

1. 了解 INTEL8086 处 理 需 的 通用 寄存 大 和 段 地 址 加 偏 移 地 址 的 内 
存 访问 方式 。 

2. 了 解 分 段 机 制 对 程序 重 定 位 的 好 处 。 

3. 理解 INTEL8086 处 理 需 内 存 分 段 的 本 质 ， 充 分 认识 到 这 种 分 段 
机 制 的 灵活 性 。 


2.1 最早 的 处 理 嚣 


1947 和 年， 美国 贝 尔 实 验 室 的 肖 克 利和 同事 们 一 起 发 明了 品 体 管 。 
1958 年 ， 也 许 是 受 够 了 在 一 大 堆 品 体 管 里 连接 那些 杂乱 无 章 的 导线 ， 男 
一 个 美国 人 杰克 : 基 尔 比 发 明了 和 集成 电路 。 接 着 ，1971 年 ， 在 为 日 本 人 设 
计 计 算 器 芯片 的 过 程 中 ， 受 到 局 发 的 Intel 公司 生产 了 世界 上 第 一 个 处 理 
器 INTEL 4004。 


图 2-1 所 示 的 是 INTEL 4004 处 理 占 和 它 的 设计 者 弗 德 里 科 : 法 金 
(Federico Faggin) 。 
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图 2-1 Intel 第 一 块 处 理 器 4004 和 它 的 设计 者 弗 德 里 科 : 法 金 


我 们 已 经 知道 ， 处 理 器 (Processor) 是 一 台电 子 计算 机 的 核心 ， 它 
会 在 振荡 器 脉冲 的 激励 下 ， 从 内 存 中 获取 指令 ， 并 故 起 一 系列 由 该 指令 
所 定义 的 操作 。 当 这 些 操 作 结 束 后 ， 它 接着 再 取 下 一 条 指令 。 通 常情 况 
下 ， 这 个 过 程 是 连续 不 断 、 循 环 往复 的 。 


2.2 ”寄存 器 和 算术 逻辑 部 件 


为 什么 处 理 嚣 能够 目 动 计算 ， 这 个 问题 已 经 在 我 的 上 一 本 书 《 罕 越 
计算 机 的 迷雾 》 里 讲 过 了 ， 不 过 这 些 原理 讲 起 来 很 费劲 ， 花 了 整整 一 本 
书 的 篇 幅 。 当 然 ， 如 果 你 没 看 过 这 本 书 ， 也 没关系 ， 下 面 束 来 位 持 回 顾 
一 下 。 回 顾 这 些 知识 很 有 用 ， 因 为 只 有 这 样 你 才能 知道 如 何 安 排 处 理 右 
做 事情 。 


电子 计算 机 能 做 很 多 事情 。 你 能 够 知道 明天 出 门 要 穿 厚 一 点 才 不 挨 
冻 ， 是 因为 电子 计算 机 算出 了 天 气 。 除 此 之 外 ， 它 还 能 让 你 看 电影 、 听 
音乐 、 写 文章 、 上 网 。 尽 管 表面 上 看 来 ， 这 些 用 处 和 算数 学 题 没什么 关 
系 ， 但 实质 上 ， 这 些 功能 都 是 以 数学 计算 为 基础 的 。 正 是 因为 如 此 ， 人 
们 才 会 把 “计算 "这 个 词 挂 在 嘴 边 ， 什 么 " 云 计算 ”、 “网络 计算 ”"、*64 位 计 
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处 理 问 不 是 法 师 手 里 的 仙 费 ， 它 之 所 以 能 计算 数学 三 ， 古 因为 其 特 
殊 的 设计 。 处 理 占 是 一 个 “ 亿 "， 即 占 件 ， 不 太 大 ， 有 的 是 长 方形 ， 有 的 是 
下 方形 ， 束 像 饼 干 。 实 际 上 ， 它 是 一 块 集成 电路 。 

如 图 2-2 所 示 ， 在 处 理 帮 的 压 部 或 者 
四 周 ， 有 大 量 的 引 脚 ， 可 以 接受 从 外 面 
来 的 电信 号 ， 或 者 癌 外 用 出 电信 号。 每 
个 引 脚 都 有 目 己 的 用 处 ， 和 在 往 电 路 板 上 
安 疼 的 时 候 ， 不 能 搂 钳 。 所 以 ， 如 图 中 
所 示 ， 处 理 带 和 在 生产 的 时 候 ， 都 会 故意 








处 理 器 数据 总 线 。 





号 一 个 角 ， 这 是 一 个 参照 标志 ， 可 以 确 

你 安 疼 的 人 不 会 卉 错 。 当 然 ， 并 不 是 所 

有 的 处 理 器 都 会 缺 一 个 角 ， 这 不 是 一 个 - 

问 定 个 变 的 做 法 。 图 2-2 ”处 理 器 进行 数学 运算 的 简单 原 


处 理 邢 的 引 脚 很 多 ， 其 中 有 一 部 分 
是 用 来 将 参与 运算 的 数字 壕 入 处 理 如 内 部 。 有 些 引 肢 是 复 用 的 ， 假 如 现 
在 要 进行 如 法 运算 ， 那 么 我 们 要 重复 使 用 这 些 引 脚 ， 来 依次 将 被 加 效 和 
加 数 送 入 。 


一 旦 被 加 数 通过 引 脚 送 入 处 理 磺 ， 代 表 这 个 二 进 制 数 字 的 一 组 电信 
号 了 驶 会 出 现在 与 引 脚 相连 的 内 部 线路 上 。 这 征 一 排 高 低 电 平 的 组 合 ， 代 
表 者 二 进 制 数 中 的 每 一 位 。 这 时 候 ， 必 须 用 一 个 称 为 寄存 北 〈Register) 
的 电路 锁 住 。 之 所 以 要 这 样 做 ， 征 因为 相同 的 引 脚 和 线路 马上 还 要 用 于 
输入 加 数 。 也 正 古 因为 这 个 原因 ， 这 些 内 部 线路 称 为 处 理 禹 内 部 电线 。 


同样 地 ， 加 数 也 要 锁 进 另 一 个 寄存 器 中 。 如 图 2-2 所 示 ， 否 存 右 RA 
和 RB 将 分 别 锁 存 参与 运算 的 被 加 数 和 加 数 。 此 后 ，RA 和 RB 中 的 内 容 
不 再 受 外 部 数据 线 的 影 啊 。 

寄存 器 是 双 癌 器 件 ， 可 以 在 一 端 接受 输入 并 加 以 锁 存 ， 同 时 ， 它 也 
会 在 另 一 端 产 生 一 模 一 样 的 输出 。 与 寄存 器 RA 和 RB 相连 的 ， 是 算术 逆 
辑 单元 ， 或 者 算术 逻辑 部 件 (Arithmetic Logic Unit，ALU) ， 也 就 是 图 
2-2 中 的 桶 形 部 分 。 它 是 专门 负 贡 运算 的 电路 ， 可 以 计算 加 法 、 减 法 或 者 
乘法 ， 也 可 做 逻辑 运算 。 在 这 里 ， 我 们 要 求 它 做 一 次 加 法 。 

一 旦 寄存 器 RA 和 RB 锁 存 了 参与 运算 的 两 个 数 ， 算 术 逻 辑 部 件 就 会 
输出 相 加 的 结果 ， 这 个 结果 可 以 临时 用 另外 一 个 寄存 器 RC 锁 存 ， 稍 后 再 
通过 处 理 右 数据 总 线 送 到 处 理 嚣 外面， 或 者 再 次 送 入 RA 或 RB。 

处 理 器 内 部 有 一 个 控制 右 〈 图 中 没有 画 出 ) ， 在 指令 的 执行 过 程 
中 ， 它 负责 给 各 个 部 件 发 送 控制 信号 ， 使 各 个 部 件 在 某 个 正确 的 时 间 点 
上 执行 某 个 动作 。 同 时 ， 拓 还 负责 诀 定 在 某 个 时 间 点 上 哪个 部 件 有 权 使 
用 总 线 ， 以 人 免 彼 此 发 生 冲 突 。 

处 理 器 总 是 很 繁忙 的 ， 在 它 操 作 的 过 程 中 ， 所 有 数据 在 寄存 器 里 面 
都 只 能 是 临时 存在 一 会 儿 ， 然 后 再 被 大 往 别处 ， 这 束 是 为 什么 它 被 叫做 
“寄存 器 "的 原因 。 早 期 的 处 理 占 ， 它 的 寄存 器 只 能 保存 4 比特 、8 比特 或 
16 比特 ， 分 别 叫做 4 位 、8 位 和 16 位 寄存 器 。 现 在 的 处 理 器 ， 寄 存 峰 一 
般 都 是 32 位 、64 位 其 至 更 多 。 

如 图 2-3 所 示 ，8 位 寄存 器 可 以 容纳 8 比特 (bit〉 ， 或 者 说 1 字 市 

(Byte) ， 这 是 因为 
1 byte = 8 bit 

男 外 ， 我 们 还 要 为 这 个 字 市 的 每 一 位 编 上 写 ， 编 号 古 从 石 往 左 进行 
的 ， 从 0 开始 ， 分 别 是 0、1、2、3、4、5、6、7。 在 这 里 ， 位 0 (第 1 
位 ) 是 最 低位 ， 在 最 右边 ， 位 7 (第 8 位 ) 是 最 高 位 ， 在 最 左边 。 


为 了 更 好 地 理解 上 面 这 些 概念 ， 几 中 假定 8 位 寄存 器 里 存放 的 是 二 进 
制 数 10001101， 即 十 六 进 制 的 8D。 这 时 ， 它 的 最 低位 和 最 高 位 都 是 1。 

16 位 寄存 器 可 以 存放 2 个 字 节 ， 这 称 为 1 个 字 (word) ， 各 个 数位 
的 编 亏 分 别 是 0 一 15， 其 中 0 一 7 是 低 字 节 ，8 一 15 是 高 字 节 。 实 际 上 ， 
“ 字 ” 的 概念 出 现 得 很 早 ， 也 并 非 指 16 个 比特 。 只 是 到 了 后 来 ， 才 特 指 16 
个 二 进 制 位 的 长 度 。 

32 位 寄存 器 可 以 存放 4 个 字 节 ， 这 称 为 1 个 双 字 (double word)， 
各 个 数位 的 编号 分 别 是 0 一 31， 其 中 0 一 15 是 低 字 ，16 一 31 是 高 字 。 

尽管 图 中 没有 夯 出 ， 但 是 64 位 寄存 器 可 以 容纳 更 多 的 比特 ， 也 束 是 
8 个 字 节 ， 或 者 4 个 字 。 位 数 越 多 ， 寄 存 器 所 能 保存 的 数 越 大 ， 这 是 显 而 
易 见 的 。 


学 节 
前 六 这 这 站 浊 
加 罗 同 加 加 加 加 国 
学 
15 8 7 0 
双 字 
31 10 15 0 
高 字 低 字 


图 2-3 ”寄存 硕 数 据 视 度 示意 


2.3 内 人 存储 器 


前 面 已 经 讲 过 ， 处 理 器 的 计算 过 程 ， 实 际 上 是 借助 于 寄存 器 和 算术 
逻辑 部 件 进行 的 。 那 么 ， 参 与 计算 的 数 是 从 哪里 来 的 呢 ? 管 案 是 一 个 可 
以 你 存 很 多 数字 的 电路 ， 叫 做 存储 间 (Storage 或 Memory) 。 


存储 如 的 种 类 实际 上 古人 很 多 的 ， 包 括 大 家 部 知道 的 便 盘 和 U 盘 等 。 
其 人 寄存 右 束 是 存储 占有 的 一 种 。 不 过 ， 我 们 现在 所 要 讲 到 的 和 存储器， 则 
征 万 外 一 种 东西 。 


如 图 2-4 所 示 ， 这 是 所 有 个 人 计算 机 里 部 会 用 到 的 存储 占 ， 我 们 平时 
把 它 叫 做 内 存 条 。 这 个 概念 是 这 么 来 的 ， 和 站 完 ， 它 是 计算 机 内 部 最 主要 
的 存储 上 草 ， 退 向 只 和 处 理 问 相连 ， 所 以 叫做 内 存储 右 或 者 主 存储 毅 ， 们 
称 内 存 或 主 存 。 其 次 ， 它 一 般 锐 设计 成 局 平 的 条 状 电 路 板 ， 所 以 叫 内 和 丰 


条 。 
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图 2-4 个 人 计算 机 里 使 用 的 内 存 条 


如 图 2-5 所 示 ， 和 和 宫 存 右 不 同 ， 内 存 用 于 保存 更 多 的 比特 。 对 于 用 得 
多 的 个 人 计算 机 来 说 ， 内 存 按 字 节 来 组 织 ， 单 次 访问 的 最 小 单位 是 1 字 
， 这 是 最 基本 的 存储 单元 。 如 图 中 所 示 ， 每 个 存储 单元 中 ， 各 位 的 编 
分 别 是 0 一 7。 

内 存 中 的 每 字 节 都 对 应 着 一 个 地 址 ， 如 图 2-5 所 示 ， 第 1 个 字 节 的 地 
址 是 0000H， 第 2 个 字 节 的 地 址 是 0001H， 第 3 个 字 节 的 地 址 是 0002H， 
其 他 以 此 类 推 。 注 意 ， 这 里 采用 的 是 十 六 进 制 表示 法 。 作 为 一 个 例子 ， 
因为 这 个 内 存 的 容量 是 65536 字 节 ， 所 以 最 后 一 个 字 节 的 地 址 是 
FFFFH。 


为 了 访问 内 存 ， 处 理 器 希 要 给 出 一 个 地 址 。 访 问 包括 谈 和 写 ， 为 
此 ， 处 理 器 还 要 指明 ， 本 次 访问 是 读 访 问 还 是 写 访 问 。 如 果 是 写 访 问 ， 
则 还 要 给 出 待 写 入 的 数据 。 


最 


8 位 处 理 融 包 合 8 位 的 寄存 融和 算术 远 辑 部 件 ，16 位 处 理 占 拥有 16 
位 的 寄存 此 和 算术 效 辑 部 件 ，64 位 处 理 占 则 包含 64 位 的 寄存 此 和 算术 远 
辑 部 件 。 尽 管内 存 的 最 小 组 成 单位 是 字 节 ， 但 是 ， 经 过 精心 的 设计 和 安 
排 ， 它 能 够 控 字 市 、 字 、 双 字 和 四 字 进 行 访问 。 换 句 话说 ， 仪 通过 单 次 
访问 束 能 处 理 8 位 、16 位 、32 位 或 者 64 位 的 二 进 制 数 。 注 意 ， 我 说 的 
征 单 识 访 问 ， 而 不 是 一 个 一 个 地 取出 每 个 字 节 ， 然 后 加 以 组 合 。 


FFEFF 


地 址 
读 / 写 控制 


数据 
0005 
0004 
0003 
0002 
0001 
0000 


字 长 控制 





内 存 和 内 存 访 问 示 意 


如 图 2-5 所 示 ， 处 理 器 发 出 字 长 控制 信和 号， 以 指示 本 次 访问 的 字 长 是 
8、16、32 还 是 64。 如 果 字 长 是 8， 而 且 给 出 的 地 址 是 0002H， 那 么 ， 本 
次 访问 只 会 影 啊 到 内 存 的 一 字 节 ; 如 果 字 长 是 16， 给 出 的 地 址 依然 是 
0002H， 那 么 实际 访问 的 将 是 地 址 0002H 处 的 一 个 字 ， 低 8 位 在 0002H 
中 ， 高 8 位 在 0003H 中 。 


检测 点 2.1 


人 = 全 有 让 外 
2 0 A 


2. 二进制 数 10000000 中 ， 位 〈 ) 的 那个 比特 是 “1”， 也 就 是 第 ( 
) 位 。 它 是 最 低位 还 是 最 高 位 ? 


3 一 个 存储 硕 的 容量 是 16 个 字 节 ， 地 址 范围 为 《) ~( ) 。 用 该 
存储 占 你 存 字 数据 时 ， 可 存放 〈 ) 个 字 ， 这 些 字 的 地 址 分 列 是 ( ) ,你 


存 双 字 呢 ? 


2.4 指令 和 指令 集 


从 一 开始 ， 设 计 处 理 占 的 目标 之 一 束 古 使 它 成 为 一 种 可 以 目 动 进行 
操作 的 莫 件 。 为 外 ， 偿 需要 近代 一 种 机 制 ， 来 允许 程序 员 决 定 进 行 何 种 
操作 。 


处 理 圳 何以 能 够 和 目 动 进行 操作 ， 这 不 是 本 书 的 话题 ， 大 学 里 有 这 样 
的 课程 ，《 和 穿越 计算 机 的 迷雾 》 这 本 书 也 给 出 了 通俗 化 的 答案 。 

简单 地 说 ， 人 处理 器 的 设计 者 用 菏 些 数 来 指示 处 理 器 所 进行 的 操作 ， 
这 称 为 指令 (Instruction) ， 或 者 叫 机 右 指 令 ， 因 为 只 有 处 理 器 才 认 得 它 
们 。 前 面 已 经 说 了 ， 处 理 左 内 部 有 寄存 左 和 负责 运算 的 部 件 ， 控 制 右 "分 
析 "一 个 个 指令 ， 然 后 确定 在 哪个 时 间 点 让 哪些 部 件 进行 工作 。 比 如 ， 指 
令 F4H 表示 让 人 处理 器 停机 ， 当 处 理 器 取 到 并 执行 这 条 指令 后 ， 束 停止 工 
作 。 指 令 是 集中 存放 在 内 存 里 的 ， 一 条 接着 一条， 处 理 右 的 工作 是 目 动 
按 顺 序 取出 并 加 以 执行 。 


如 图 2-6 所 示 ， 从 内 存 地 址 0000H 开始 (也 就 是 内 存 地 址 的 最 低 
癌 ) 连续 存放 了 一 些 指 令 。 同 时 ， 假 定 执行 这 些 指 令 的 是 一 个 16 位 人 处理 
器 ， 拥 有 两 个 16 位 的 寄存 器 RA 和 RB。 

一 般 来 说 ， 指 令 由 操作 码 和 操作 数 构 成 ， 但 也 有 小 部 分 指令 仅 有 操 
作 人 码 ， 而 不 含 操作 数 。 如 图 2-6 所 示 ， 停 机 指令 仅 包 含 1 字 节 的 操作 三 
F4， 而 没有 操作 数 。 指 令 的 长 上 度 不 定 ， 短 的 指令 仅 有 1 字 节 ， 而 长 的 指 
令 则 有 可 能 达到 15 字 市 (对 于 INTEL x86 处 理 圳 来 说 ) 。 


FFFF 


0040 
003F 


000C 
000B 
000A 
0009 
0008 
0007 
0000 
0005 
0004 
0003 
0002 
0001 
0000 


将 RA 中 的 内 容 传 送 到 地 址 单元 003F 


将 RA 和 RB 中 的 内 容 相 加 ， 结 果 保 存在 RA 寄存 器 


将 003F 地 址 单元 里 的 数 传送 到 RB 寄存 器 


将 立即 数 005D 传 送 到 RA 寄存 器 





图 2-6 ”处 理 硕 指令 在 内 存 中 的 布局 


对 处 理 豆 来 说 ， 指 令 的 操作 码 隐 含 了 如 何 执行 该 指令 的 信息 ， 比 如 
它 古 做 什么 的 ， 以 及 怎么 去 做 。 第 一 条 指令 的 操作 码 是 B8， 这 表明 ， 议 
指令 是 一 条 传送 指令 ， 第 一 个 操作 数 是 寄存 堪 ， 第 二 个 操作 数 是 直接 包 
含 在 指令 中 的 ， 案 跟 在 操作 码 之 后 ， 可 以 立即 从 指令 中 取得 ， 所 以 叫做 
立即 数 (Immediate Operand) 。 同 时 ， 操 作 码 还 直接 指出 该 寄存 器 是 
RA。RA 是 16 位 寄存 占 ， 这 条 指令 将 按 字 进行 操作 。 所 以 ， 当 这 条 指令 
执行 之 后 ， 该 指令 的 操作 数 〈 立 即 数 ) 005DH 就 被 传送 到 RA 中 。 

既然 操作 码 中 隐 令 了 这 么 多 的 信息 ， 那 么 ， 处 理 占 就 可 以 “知道 "每 条 
指令 的 长 度 。 这 样 ， 当 它 执 行 第 一 条 指令 B8 5D 00 的 时 候 ， 就 已 经 知 
道 ， 这 是 一 个 3 字 节 指令 ， 下 一 条 指令 位 于 3 个 字 市 之 后 ， 即 内 存 地 址 
0003H 处 。 


注意 字数 据 在 内 存 中 的 存放 特点 。 地 址 0001H 和 0002H 里 的 内 容 分 
别 是 5D 和 00， 如 果 每 次 读 一 个 字 节 ， 则 从 地 址 0001H 里 读 出 的 是 5D， 
从 0002H 里 恋 出 的 是 00。 但 如 果 以 字 的 方式 来 访问 地 址 0001H， 旋 到 的 
就 会 是 005DH。 这 种 差别 ， 跟 处 理 器 和 内 存 之 间 的 数据 线 连接 方式 有 
关 。 对 于 Intel 处 理 鼎 来 说 ， 如 果 访 问 内 存 中 的 一 个 字 ， 那 么 ， 它 规定 局 
字 节 位 于 高 地 址 部 分 ， 低 字 节 位 于 低地 址 部 分 ， 这 称 为 低 端 字 节 序 
(Little Endian) 。 至 于 其 他 公司 的 处 理 器 ， 则 可 能 情况 正好 相反 ， 称 为 
局 蜗 字 市 序 。 

对 于 复杂 一 些 的 指令 来 说 ，1 个 字 贡 的 操作 人 码 可 能 不 会 够 用 。 上 所 以 ， 
第 2 条 指令 的 操作 人 码 为 8B 1E， 它 隐 舍 的 意思 是 ， 这 是 一 条 传送 指令 ， 第 
一 个 操作 数 是 寄存 器 ， 而 且 是 RB 寄存 器 ， 第 二 个 操作 数 是 内 存 地 址 ， 要 
传送 到 RB 寄存 器 中 的 数 存放 在 该 地 址 中 。 同 时 ， 这 是 一 个 字 操 作 指 令 ， 
应 当 从 第 二 个 操作 数 指 定 的 地 址 中 取出 一 个 字 。 

该 指令 的 操作 数 部 分 是 3F 00， 指 定 了 一 个 内 存 地 址 003FH。 它 相当 
于 高 级 语言 里 的 指针 ， 当 处 理 右 执行 这 条 指令 时 ， 会 再 次 用 003FH 作为 
地 址 去 访问 内 存 ， 从 那里 取出 一 个 字 《〈1002H) ， 然 后 将 它 传送 到 寄存 
人 锅 RB。 注 意 ,，“ 传 送 " 这 个 词 市 有 误导 性 。 其 实 ， 传 送 的 意思 更 像 是 “ 复 
制 ”， 传 送 之 后 ，003FH 单元 里 的 数据 还 保持 原样 。 

通过 这 两 条 指令 的 比较 ， 很 容易 分 清 指令 中 的 “立即 数 " 是 什么 意思 。 
指令 执行 和 操作 的 对 象 是 数 。 如 果 这 个 数 已 经 在 指令 中 给 出 了 ， 不 需要 
再 次 访问 内 存 ， 那 这 个 数 束 是 立即 数 ， 比 如 第 一 条 指令 中 的 005DH; 相 
反 ， 如 果 指 令 中 给 出 的 是 地 址 ， 真 正 的 数 还 需要 用 这 个 地 址 访问 内 存 才 
能 得 到 ， 那 它 束 不 能 称 为 立即 数 ， 比 如 第 二 条 指令 中 的 003FH。 

如 图 2-6 所 示 ， 余 下 的 三 条 指令 ， 和 劳 边 都 有 注解 ， 这 里 残 不 绸 一 一 解 
释 了 。 如 果 一 开始 内 存 地 址 003FH 中 存放 的 是 1002H， 那 么 ， 当 所 有 这 
些 指令 执行 完 后 ，003FH 里 就 是 最 终 的 结果 105FH。 


指令 和 非 指 令 的 普通 二 进 制 数 是 一 个 一 样 的 ， 在 组 成 内 存 的 电路 
中 ， 都 是 一 些 局 低 电 平 的 组 合 。 因 为 处 理 豆 是 目 动 按 有 顺序 取 指 令 并 加 以 
执行 的 ， 在 指令 中 混 森 了 非 指 令 的 数据 会 导致 处 理 占 不 能 正常 工作 。 为 
此 ， 指 令 和 数据 要 分 开 人 存放 ， 分 别 位 于 内 存 中 的 不 同 区 域 ， 存 放 指 令 的 
区 域 叫 代码 区 ， 和 存放 数据 的 区 域 叫 数据 区 。 为 了 让 处 理 右 正确 识 列 和 执 
行 指令 ， 工 程 拉 术 人 员 必 须 精心 安排 ， 并 告诉 处 理 紫 要 执行 的 指令 位 于 
内 存 中 的 什么 位 置 。 


还 是 那 句 话 ， 并 非 每 一 个 二 进 制 数 都 代表 着 一 条 指令 。 每 种 处 理 器 
在 设计 的 时 候 ， 也 只 能 拥有 有 限 的 指令 ， 从 几 十 条 到 几 百 条 不 等 。 一 个 
处 理 嚣 能够 识别 的 指令 的 集合 ， 称 为 该 处 理 器 的 指令 集 。 

检测 点 2.2 

在 内 存 中 ， 指 令 和 数据 一 模 一 样 ， 都 是 无 兰 别 的 数 。 如 图 2-6 所 示 ， 
假如 处 理 喜 访问 内 存 时 是 按 低 端 字 节 序 的 ， 那 么 ， 从 地 址 0008H 处 取出 
一 个 字 时 ， 该 字 的 值 为 〈 ) 。 


2.5 古老 的 Intel 8086 “处理 器 


任何 时 候 ， 一 旦 提 到 Intel 公司 的 处 理 嚣 ， 束 不 能 不 说 8086。8086 
是 Intel 公司 第 一 款 16 位 处 理 器 ， 诞 生 于 1978 年 ， 所 以 说 它 很 古老 。 


但 是 ， 在 Intel 公司 的 所 有 处 理 器 中 ， 它 占有 很 重要 的 地 位 ， 是 整个 
Intel 32 位 架构 处 理 右 (IA-32) 的 开山 时 祖 。 首 先 ， 最 重要 的 一 点 是 ， 
它 是 一 款 非 党 成功 的 产品 ， 设 计 先进 ， 功 能 很 强 ， 卖 得 很 好 。 

其 次 ，8086 的 成 功 使 得 市 场 上 出 现 了 大 量 针 对 它 开发 的 软件 产品 。 
这 样 ， 当 |ntel 公司 要 设计 新 的 处 理 器 时 ， 它 不 得 不 考虑 到 兼容 性 的 问 
题 。 要 使 得 老 的 软件 也 能 在 新 的 处 理 器 上 很 好 地 运行 ， 必 须要 具备 指令 
集 和 工作 模式 上 的 兼容 性 和 一 致 性 。lntel 公司 很 清楚 ， 如 果 新 处 理 器 和 
老 处 理 磊 不 车 容 ， 那 么 ， 新 处 理 需 越 多 ， 它 扔 挥 的 拥 息 也 吏 越 多 ， 要 不 
了 了 多久， 这 公司 就 不 用 再 开 了 。 

所 以 ， 当 我 们 讲述 处 理 器 的 时 候 ， 必 须要 从 8086 开始 ; 而且， 要 学 
习 汇 编 语 言 ， 针 对 8086 的 汇编 技术 也 是 必 不 可 少 的 。 


2.5.1 8086 的 通用 寄存 器 


8086 处 理 器 内 部 有 8 个 16 位 的 通用 寄存 器 ， 分 别 被 命名 为 AX、 
BX、CX、DX、SI、DI、BP、SP。“ 通 用 ”的 意思 是 ， 它 们 之 中 的 大 部 分 
都 可 以 根据 需要 用 于 多 种 目的 。 

如 图 2-7 所 示 ， 因 为 这 8 个 寄存 项 都 是 16 位 的 ， 所 以 通常 用 于 进行 
16 位 的 操作 。 比 如 ， 可 以 在 这 8 个 寄存 器 之 间 互 相传 送 数据 ， 它 们 之 间 
也 可 以 进行 算术 逻辑 运算 ; 也 可 以 在 它们 和 内 存单 元 之 间 进 行 16 位 的 数 
据 传 大 或 者 算术 馆 辑 运算 。 

同时 ， 如 图 2-7 所 示 ， 这 8 个 寄存 右 中 的 前 4 个 ， 即 AX、BX、CX 和 
DX， 又 各 目 可 以 拆 分 成 两 个 8 位 的 寄存 右 来 使 用 ， 总 共 可 以 提供 8 个 8 
位 的 寄存 器 AH、AL、BH、BL、CH、CL、DH 和 DL。 这 样 一 来 ， 当 需 
要 在 寄存 如 和 寄存 峰之 间 ， 或 者 窜 存 器 和 内 存 早 元 之 间 进 行 8 位 的 数据 传 
送 或 者 算术 逻辑 运算 时 ， 使 用 它们 就 很 方便 。 


图 2-7 8086 的 通用 寄存 疮 


将 一 个 16 位 的 寄存 右 当 成 两 个 8 位 的 寄存 右 来 用 时 ， 对 其 中 一 个 8 
位 寄存 项 的 操作 不 会 影响 到 另 一 个 8 位 寄存 占 。 举 个 例子 来 说 ， 当 你 操作 
寄存 苍 AL 时 ， 不 会 影响 到 AH 中 的 内 容 。 


2.5.2 ”程序 的 重 定位 难题 


我 们 知道 ， 处 理 堆 是 目 动 化 的 融 件 ， 在 给 出 了 起 始 地 址 之 后 ， 它 将 
从 这 个 地 址 开始 ， 目 动 地 取出 每 条 指令 并 加 以 执行 。 只 要 每 条 指令 都 正 
确 无 误 ， 它 束 能 准确 地 知道 下 一 条 指令 的 地 址 。 这 束 意 味 看 ， 完 成 条 个 
工作 的 所 有 指令 ， 必 须 集 中 在 一 起 ， 处 于 内 存 的 菜 个 位 置 ， 形 成 一 个 
段 ， 叫 做 代码 段 。 事 情 是 明 摆 看 的 ， 要 是 指令 并 没有 一 条 换 看 一 条 存 
放 ， 中 间 严 杂 了 其 他 非 指令 的 数据 ， 处 理 需 将 因为 不 能 识别 而 出 错 。 

为 了 做 条件 事 而 编写 的 指令 ， 它 们 一 起 形成 了 我 们 平时 所 说 的 程 
序 。 程 序 总 要 操作 大 量 的 数据 ， 这 些 数 据 也 应 该 集中 在 一 起 ， 位 于 内 存 
中 的 菏 个 地 方 ， 形 成 一 个 段 ， 叫 做 数据 段 。 

注意 ， 我 们 并 没有 改变 内 存 的 物理 性 质 ， 并 不 是 真 的 把 它 分 成 几 
块 。 段 的 划分 是 逻辑 上 的 ， 从 本 质 上 来 说 ， 是 如 何 看 每 和 组 织 内 存 中 的 
数据 。 

段 在 内 存 中 的 位 置 并 不 重要 ， 因 为 处 理 天 是 可 控 的 ， 我 们 可 以 让 和 它 
从 内 存 的 任何 位 置 开 始 取 指 令 并 加 以 执行 。 这 里 有 一 个 例子 ， 如 图 2-8 所 
示 ， 我 们 有 一 大 堆 数 字 ， 现 在 想 把 它们 加 起 来 求 出 一 个 总 和 。 


FFFF 


012A 
0129 
0128 
0127 
0126 
0125 
0124 
0123 
0122 
0121 
0120 


将 AX 的 内 容 和 地 址 单元 0104H 里 的 数 相 加 ， 结 果 在 AX 中 


代码 段 


将 地 址 单元 0100H 里 的 数 传 送 到 AX 寄 存 器 





NN 1 一 一 结果 在 AX 中 


0104 
数据 段 


0102 


0100 





[| 


0000 


图 2-8 程序 的 代码 段 和 数据 段 示例 


假定 我 们 有 16 个 数 要 相 加 ， 这 些 数 都 是 16 位 的 二 进 制 数 ， 分 别 是 
0005H、00AOH、00FFH、...。 为 了 让 处 理 絮 把 它们 加 起 来 ， 我 们 应 访 
先 在 内 存 中 定义 一 个 数据 段 ， 将 这 些 数 字 写 进去 。 数 据 段 可 以 起 始 于 内 
存 中 的 任何 位 置 ， 既 然 如 此 ， 我 们 将 它 定 在 0100H 处 。 这 样 一 来 ， 第 一 


个 要 加 的 数位 于 地 址 0100H， 第 二 个 要 加 的 数位 于 地 址 0102H， 最 后 一 
个 数 的 地 址 是 011EH。 


一 旦 定义 了 数据 段 ， 我 们 就 知道 了 每 个 数 的 内 存 地 址 。 然 后 ， 紧 挨 
看 数据 段 ， 我 们 从 内 存 地 址 0120H 处 定义 代码 段 。 严 格 地 说 ， 数 据 段 和 
代码 段 是 不 需要 连续 的 ， 但 这 里 把 它们 换 在 一 起 更 目 然 一 些 。 为 了 区 别 
数据 段 和 代码 段 ， 我 们 使 用 了 不 同 的 撒 色 。 


代码 段 是 从 内 存 地 址 0120H 处 开始 的 ， 第 一 条 指令 是 A1 00 01， 其 
功能 是 将 内 存单 元 0100H 里 的 字 传 送 到 AX 寄存 器 。 指 令 执 行 后 ，AX 的 
内 容 为 0005H。 

第 二 条 指令 是 03 06 02 01， 功 能 是 将 AX 中 的 内 容 和 内 存单 元 0102H 
里 的 字 相 加 ， 结 果 在 AX 中 。 由 于 AX 的 内 容 为 0005H， 而 内 存 地 址 
0102H 里 的 数 是 00A0H， 这 条 指令 执行 后 ，AX 的 内 容 为 00A5H。 


第 三 条 指令 是 03 06 04 01， 功 能 是 将 AX 中 的 内 容 和 内 存单 元 0104H 
里 的 字 相 加 ， 结 果 在 AX 中 。 此 时 ， 由 于 AX 里 的 内 容 是 00A5H， 内 存 地 
址 0104H 里 的 数 是 00FFH， 本 指令 执行 后 ，AX 的 内 容 为 01A4H。 


后 面 的 指令 没有 列 出 ， 但 和 前 2 条 指令 相似 ， 依 次 用 AX 的 内 容 和 下 
一 个 内 存单 元 里 的 字 相 加 ， 一 直到 最 后 ， 在 AX 中 得 到 总 的 昧 加 和 。 在 这 
个 例子 中 ， 我 们 没有 考虑 AX 寄存 器 容纳 不 下 结果 的 情况 。 当 累加 的 总 和 
超出 了 AX 所 能 表示 的 数 的 范围 《最 大 为 FFFFH， 即 十 进 制 的 65535 ) 
时 ， 就 会 产生 进位 ， 但 这 个 进位 被 丢弃 。 

在 内 存 中 定义 了 数据 段 和 代码 段 之 后 ， 我 们 就 可 以 命令 处 理 器 从 内 
存 地 址 0120H 处 开始 执行 。 当 所 有 的 指令 执行 完 后 ， 束 能 在 AX 寄存 器 中 
得 到 最 后 的 结果 。 

看 起 来 没有 什么 问题 ， 一 切 都 很 完美 ， 不 是 吗 ? 那 本 节 标 题 中 所 说 
的 难题 又 从 何 而 来 呢 ? 

这 里 确实 有 一 个 难题 。 

在 前 面 的 例子 中 ， 所 有 在 执行 时 需要 访问 内 存单 元 的 指令 ， 使 用 的 
都 是 真实 的 内 存 地 址 。 比 如 A1 00 01， 这 条 指令 的 意思 是 从 地 址 为 
0100H 的 内 存单 元 里 取出 一 个 字 ， 并 传 壕 到 寄存 右 AX。 在 这 里 ，0100H 
是 一 个 真实 的 内 存 地 址 ， 又 称 物理 地 址 。 


整个 程序 〈 包 括 代 码 段 和 数据 段 ) 在 内 存 中 的 位 置 ， 是 由 我 们 自己 
定 的 。 我 们 把 数据 段 定 在 0100H， 把 代码 段 定 在 0120H。 


问题 是 ， 大 多 数 时 候 ， 整 个 程序 〈 包 括 代 人 码 段 和 数据 段 ) 在 内 存 中 
的 位 置 并 不 是 我 们 能 够 决定 的 。 请 想 一 想 你 平时 是 怎么 使 用 计算 机 的 ， 
你 所 用 的 程序 ， 包 括 那 些 用 来 调整 计算 机 性 能 的 工具 、 小 游戏 、 音 乐 和 
视频 播放 需 等 ， 都 是 从 网 上 下 载 的 ， 位 于 你 的 硬盘 、U 盘 或 光盘 中 。 即 
使 有 些 程序 是 你 上 自己 编写 的 ， 那 又 如 何 ? 当 你 双击 它们 的 图 标 ， 使 它们 
在 Windows 里 启动 之 前 ， 内 存 已 经 被 塞 了 很 多 东西 ， 束 算 你 是 刚刚 打开 
计算 机 ，Windows 目 己 已 经 占用 了 很 多 内 存 空间 ， 不 然 的 话 ， 你 怎么 可 
能 在 它 上 面 操 作 呢 ? 

在 这 种 情况 下 ， 你 所 运行 的 程序 ， 在 内 存 中 被 加 载 的 位 置 完全 是 随 
机 的 ， 哪 里 有 空 用 的 地 方 ， 它 束 会 被 加 载 到 哪里 ， 并 从 那里 开始 被 处 理 
右 执 行 。 所 以 ， 前 面 那 段 程 序 不 可 能 恰好 如 你 所 愿 ， 被 加载 到 内 存 地 址 
0100H， 它 完全 可 能 被 加 载 到 为 一 个 不 同 的 位 置 ， 比 如 1000H。 但 是 ， 
同样 是 那个 程序 ， 一 旦 它 在 内 存 中 的 位 置 发 生 了 改变 ， 灾 难 就 出 现 了 。 

如 图 2-9 所 示 ， 因 为 程序 现在 是 从 内 存 地 址 1000H 处 被 加 载 的 ， 所 
以 ， 数 据 段 的 起 始 地 址 为 1000H。 这 就 是 说 ， 第 一 个 要 加 的 数 ， 其 地 址 
为 1000H， 第 二 个 则 为 1002H， 其 他 以 此 类推 。 代 人 码 段 依然 树 换 看 数据 
段 之 后 ， 起 始 地 址 相应 地 是 1020H 。 


只 要 所 有 的 指令 都 是 连续 存放 的 ， 代 码 段位 于 内 存 中 的 什么 地 方 都 
可 以 正 稼 执行 。 所 以 ， 处 理 需 可 以 按 你 的 要 求 ， 从 内 存 地 址 1020H 处 连 
续 执 行 ， 但 结果 完全 不 是 你 想 要 的 。 


请 看 第 一 条 指令 A1 00 01， 它 的 意思 是 从 内 存 地 址 0100 处 取得 一 个 
字 ， 将 其 传送 到 寄存 器 AX。 但 是 ， 由 于 程序 刚刚 改变 了 位 置 ， 它 要 取 的 
那个 数 ， 现 在 实际 上 位 于 1000H， 它 取 的 是 别人 地 盘 里 的 数 ! 

这 能 怪 谁 呢 ? 发 生 这 样 的 事情 ， 是 因为 我 们 在 指令 中 使 用 了 绝对 内 
存 地 址 (物理 地 址 ) ， 这 样 的 程序 是 无 法 重 定 位 的 。 为 了 让 你 写 的 程序 
在 卖 给 别人 之 后 ， 可 以 在 内 存 中 的 任何 地 方正 确 执 行 ， 就 只 能 在 编写 程 
序 的 时 候 使 用 相对 地 址 或 者 逻辑 地 址 了 ， 而 不 能 使 用 真实 的 物理 地 址 。 
当 程 序 加 载 时 ， 这 些 相 对 地 址 还 要 根据 程序 实际 被 加 载 的 位 置 重 新 计 
0 

在 任何 时 候 ， 程 序 的 重 定 位 都 是 非常 环 手 的 事情 。 当 然 ， 也 有 好 几 
种 解决 的 办 法 。 在 8086 处 理 器 上 ， 这 个 问题 特别 容易 解决 ， 因 为 该 处 理 
器 在 访问 内 存 时 使 用 了 分 段 机 制 ， 我 们 可 以 借助 该 机 制 。 


2.5.3 ”内 存 分 段 
机 制 


如 图 2-10 所 示 ， 整 
个 内 存 空间 就 像 长 长 的 
纸 条 ， 在 内 存 中 分 段 ， 
就 像 从 长 纸 条 中 裁 下 一 
小 段 来 。 根 据 需 要 ， 段 
可 以 开始 于 内 存 中 的 任 
何人 位置， 比如 图 中 的 内 
存 地 址 A532H 处 。 


在 这 个 例子 中 ， 分 
段 开 始 于 地 址 为 A532H 
的 内 存单 元 处 ， 这 个 起 
始 地 址 就 是 段 地 址 。 

这 个 分 段 包 含 了 6 
个 存储 单元 。 在 分 段 之 
前 ， 它 们 在 整个 内 存 空 
间 里 的 物理 地 址 分 别 是 
A532H 、 A533H 、 
A534H 、 A535H 、 
A536H、A537H。 

{SE A 
后 ， 它 们 的 地 址 可 以 只 
相对 于 自己 所 在 的 段 。 
这 样 ， 它 们 相对 于 段 开 


代码 段 


数据 段 


FFEF 


将 AX 的 内 容 和 地 址 
单元 0104H 里 的 数 相 
加 ， 结 果 在 AX 中 


N \ | 
SS 
将 AX 的 内 容 和 地 址 
单元 0102H 里 的 数 相 
NS SS 人 加 ， 结果 在 AX 中 


将 地 址 单元 0100H 里 
的 数 传送 到 AX 寄 存 器 





始 处 的 距离 分 别 为 0、 图 2-9 在 指令 中 使 用 绝对 内 存 地 址 的 程序 是 不 可 重 定位 的 


1、2、3、4、5， 这 叫 
做 偏 移 地 址 。 


于 是 ， 当 灯 用 分 段 案 略 之 后 ， 一 个 内 存单 元 的 地 址 实际 上 就 可 以 用 
“ 段 ， 偏 移 " 或 者 “ 段 地 址 : 偏 移 地 址 "来 表示 ， 这 就 是 通常 所 说 的 逻辑 地 
址 。 比 如 ， 在 图 2-10 中 ， 段 内 第 1 个 存储 单元 的 地 址 为 A532H:0000H， 
第 3 个 存储 单元 的 地 址 为 A532H:0002H， 而 本 段 最 后 一 个 存储 单元 的 地 


址 则 是 A532H:0005H 。 


FFEF | | 


A538 
和 3 入。 > A532: 0005 
于 各 = > A532: 0004 
EE > A532: 0003 
6 个 字 节 的 段 
二 > A532: 0002 
I > A532: 0001 
A532 PE > A532: 0000 
A531 


0000 


图 2-10 ”上段 地 址 和 偏 移 地 址 示意 图 


为 了 在 人 硬件 一 级 提供 对 “ 段 地 址 : 偏 移 地 址 ”内存 访问 模式 的 支持， 处 
理 右 人 至少 要 提供 两 个 段 奇 存 器 ， 分 别 是 代码 段 奇 存 嚣 (Code Segment， 
CS) 和 数据 段 寄 存 器 (Data Segment，DS) 。 


对 CS 内 容 的 改变 将 导致 处 理 器 从 新 的 代码 段 开 始 执 行 。 同 样 ， 在 开 
台 访 问 内 存 中 的 数据 之 前 ， 也 必须 首先 设置 好 DS 寄存 右 ， 使 之 指 问 数 据 
段 。 

除 此 之 外 ， 最 重要 的 是 ， 当 处 理 器 访问 内 存 时 ， 它 把 指令 中 指定 的 
内 存 地 址 看 成 是 段 内 的 偏 移 地 址 ， 而 不 是 物理 地 址 。 这 样 ， 一 旦 处 理 器 
遇 到 一 条 访问 内 存 的 指令 ， 它 将 把 DS 中 的 数据 段 起 始 地 址 和 指令 中 提供 
的 段 内 偏 移 相 加 ， 来 得 到 访问 内 存 所 需要 的 物理 地 址 。 

如 图 2-11 所 示 ， 代 码 段 的 段 地 址 为 1020H， 数 据 段 的 段 地 址 为 
1000H 。 在 代码 段 中 有 一 条 指令 A1 02 00， 它 的 功能 是 将 地 址 0002H 处 
的 一 个 字 传 送 到 寄存 器 AX。 在 这 里 ， 处 理 器 将 0002H 看 成 是 段 内 的 偏 移 


地 址 ， 段 地 址 在 DS 中 ， 应 该 在 执行 这 条 指令 之 前 就 已 经 用 别 的 指令 传送 
到 DS 中 了 。 

当 执 行 指 令 A1 02 00 时 ， 处 理 器 将 把 DS 中 的 内 容 和 指令 中 指定 的 
偏 移 地 址 0002H 相 加 ， 得 到 1002H。 这 是 一 个 物理 地 址 ， 处 理 器 用 它 来 
访问 内 存 ， 束 可 以 得 到 所 需要 的 数 00AOH。 

如 果 一 下 次 执行 这 个 程序 时 ， 代 码 段 和 数据 段 在 内 存 中 的 位 置 发 生 
了 变化 ， 只 要 把 它们 的 段 地 址 分 别传 送 到 CS 和 DS， 它 也 能 够 正人 确 执 
行 。 


0000 


图 2-11 ”从 逻辑 地 址 到 物理 地 址 的 转换 过 程 


2.5.4 8086 的 内 存 分 段 机制 





表面 讲 了 如 何 从 包 辑 地 址 转换 到 物理 地 址 ， 以 使 得 程序 的 运行 和 稀 
在 内 存 中 的 位 置 无 关 。 这 种 策略 在 很 多 人 处理 器 中 得 到 了 支持 ， 包 括 8086 
处 理 嚣 。 但 是 ， 由 于 8086 目 映 的 局 限 性 ， 它 的 做 法 还 要 复杂 一 些 。 

如 图 2-12 所 示 ，8086 内 部 有 8 个 16 位 的 通用 寄存 器 ， 分 别 是 AX、 
BX、CX、DX、SI、DI、BP、SP。 其 中 ， 前 四 个 寄存 器 中 的 每 一 个 ， 都 
还 可 以 当成 两 个 8 位 的 寄存 器 来 使 用 ， 分 别 是 AH、AL、BH、BL、CH、 
CL、DH、DL。 





地 址 线 的 高 4 位 
A16 一 A19 


16 位 数据 线 和 


地 址 线 的 低 16 
位 〈( 复 用 ) 


AD0 一 AD15 





日 
让 贷 呈 辣 泪 证 


控制 信号 


控制 和 
6 字 节 的 指令 预 取 队 询 
图 2-12 8086 处 理 占 内 部 组 成 框图 


在 进行 数据 传送 或 者 算术 逻辑 运算 的 时 候 ， 使 用 算术 逻辑 部 件 
(CALU) 。 比 如 ， 将 AX 的 内 容 和 CX 的 内 容 相 加 ， 结 果 仍 在 AX 中 ， 那 
么 ， 在 相 加 的 结果 返回 到 AX 之 前， 雷 要 通过 一 个 叫 数据 暂 存 右 的 架 存 右 
中 转 。 

处 理 右 能 够 自动 运行 ， 这 是 控制 右 的 功 芳 。 为 了 加 快 指令 执行 速 
度 ，8086 内 部 有 一 个 6 字 节 的 指令 预 取 队 列 ， 在 处 理 器 忙 着 执行 那些 不 
需要 访问 内 存 的 指令 时 ， 指 令 预 取 部 件 可 以 趁机 访问 内 存 预 取 指 令 。 这 
时 ， 多 达 6 个 字 节 的 指令 流 可 以 排队 等 竺 解 权 和 执行 。 

8086 内 部 有 4 个 段 寄存 器 。 其 中 ，CS 是 代码 段 寄 存 器 ，DS 是 数据 
段 寄存 器 ，ES 是 附加 段 〈Extra Segment) 寄存 器 。 附 加 段 的 意思 是 ， 
它 是 额外 赠送 的 礼物 ， 当 需要 在 程序 中 同时 使 用 两 个 数据 段 时 ，DS 指 同 
一 个 ，ES 指 癌 男 一 个 。 可 以 在 指令 中 指定 使 用 DS 和 ES 中 的 哪 一 个 ， 


如 果 没 有 指定 ， 则 默认 是 使 用 DS。SS 是 栈 段 寄存 器 ， 以 后 会 讲 到 ， 而 
日 韭 常 重要 。 

IP 是 指令 指针 (nstruction Pointer ) 寄存 器 ， 它 只 和 CS 一 起 使 
用 ， 而 且 只 有 人 处理 右 才 能 下 接 改 变 它 的 内 容 。 当 一 上 段 代码 开始 执行 时 ， 
CS 指 同 代码 段 的 起 始 地 址 ，|IP 则 指向 段 内 偏 移 。 这 样 ， 由 CS 和 IP 共同 
形成 逻辑 地 址 ， 并 由 总 线 接口 部 件 变 换 成 物理 地 址 来 取得 指令 。 然 后 ， 
处 理 器 会 目 动 根据 当前 指令 的 长 度 来 改变 IP 的 值 ， 使 它 指 问 下 一 条 指 


令 。 


当 然 ， 如 朱 在 指令 的 执行 过 程 中 需要 访问 内 存单 元 ， 那 么 ， 处 理 夫 
将 用 DS 的 值 和 指令 中 提供 的 偏 移 地 址 相 加 ， 来 形成 访问 内 存 所 需 的 物理 
地 址 。 


8086 的 段 寄 存 器 和 IP 寄存 器 都 是 16 位 的 ， 如 果 按 照 原 先 的 方式 ， 
把 段 和 寄存器 的 内 容 和 偏 移 地 址 直接 相 加 来 形成 物理 地 址 的 话 ， 也 只 能 得 
到 16 位 的 物理 地 址 。 麻 烦 的 是 ，8086 却 提供 了 20 根 地 址 线 。 换 句 话 
说 ， 它 提供 的 是 20 位 的 物理 地 址 。 

提供 20 位 地 址 线 的 原因 很 简单 ，16 位 的 物理 地 址 只 能 访问 64KB 的 
内 存 ， 地 址 范围 是 0000H 一 FFFFH， 共 65536 个 字 节 。 这 样 的 容量 ， 即 
使 是 在 那个 年 代 ， 也 显得 捉襟见肘 。 注 意 ， 这 里 提 到 了 一 个 表示 内 存 容 
量 的 单位 “KB”。 为 了 方便 ， 我 们 通常 使 用 更 大 的 单位 来 描述 内 存 容量 ， 
比如 千 字 节 (KB) 、 兆 字 节 (MB) 和 吉 字 节 (GB) ， 它 们 之 间 的 换算 
关系 如 下 : 





1 KB = 1024 Byte 
1 MB = 1024 KB 
1 GB = 1024 MB 


所 以 ，65536 个 字 节 就 是 64KB， 而 20 位 的 物理 地 址 则 可 以 访问 多 
达 1MB 的 内 存 ， 地 址 范围 从 00000H 到 FFFFFH。 问 题 是 ，16 位 的 段 地 
址 和 16 位 的 偏 移 地 址 相 加 ， 只 能 形成 16 位 的 物理 地 址 ， 怎 么 得 到 这 20 
位 的 物理 地 址 呢 ? 


为 了 解决 这 个 问题 ，8086 处 理 器 在 形成 物理 地 址 时 ， 先 将 段 寄存 器 
的 内 容 左 移 4 位 (相当 于 乘 以 十 六 进 制 的 10， 或 者 十 进 制 的 16) ， 形 成 
20 位 的 段 地 址 ， 然 后 再 同 16 位 的 偏 移 地 址 相 加 ， 得 到 20 位 的 物理 地 
址 。 比 如 ， 对 于 逻辑 地 址 F000H:052DH， 处 理 器 在 形成 物理 地 址 时 ， 将 


段 地 址 F000H 左 移 4 位 ， 变 成 F0000H， 再 加 上 偏 移 地 址 052DH， 就 形成 
了 20 位 的 物理 地 址 F052DH。 

这 样 ， 因 为 段 寄 存 右 是 16 位 的 ， 在 段 不 重 登 的 情况 下 ， 最 多 可 以 将 
1MB 的 内 存 分 成 65536 个 段 ， 段 地 址 分 别 是 0000H、0001H 、0002H、 
0003H，.. ， 一 直到 FFFFH。 在 这 种 情况 下 ， 如 图 2-13 所 示 ， 每 个 段 
正好 16 个 字 节 ， 偏 移 地 址 从 0000H 到 000FH。 


i 


: 0002 00012 
: 0001 00011 
0001: 0000 00010 
: O00F 0000F 
: 000E 0000E 
: 000D 0000D 
: 000C 0000C 
: 000B 0000B 
逻辑 地 址 : 000A 0000A 连续 的 物理 地 址 
: 0009 00009 
: 0008 00008 
: 0007 00007 
: 0006 00006 
: 0005 00005 
: 0004 00004 
: 0003 00003 
: 0002 00002 
: 0001 00001 
0000: 0000 00000 


图 2-13 1MB 内 存 可 以 划分 为 65536 个 16 字 贡 的 段 


同样 在 不 允许 段 之 间 重 登 的 情况 下 ， 每 个 段 的 最 大 长 度 是 64KB， 
为 偏 移 地 址 也 是 16 位 的 ， 从 0000H 到 FFFFH。 在 这 种 情况 下 ，1MB 的 
内 存 ， 最 多 只 能 划分 成 16 个 段 ， 每 段 长 64KB， 段 地 址 分 别 是 0000H、 
1000H、2000H、3000H，...， 一 直到 FOOOH。 

以 上 所 说 的 只 是 两 种 最 典型 的 情况 。 通 常情 况 下 ， 段 地 址 的 选择 取 
决 于 内 存 中 哪些 区 域 是 空 闪 的 。 举 个 例子 来 说， 假如 从 物理 地 址 00000H 


开始 ， 一 直到 82251H 处 都 被 其 他 程序 占用 着 ， 而 后 面 一 直到 FFFFFH 的 
地 址 空间 都 是 自由 的 ， 那 么 ， 你 可 以 从 物理 内 存 地 址 82251H 之 后 的 地 方 
加 载 你 的 程序 。 

接着 ， 你 的 任务 是 定义 段 地 址 并 设置 处 理 需 的 段 寄 存 器 ， 其 中 最 重 
要 的 是 段 地 址 的 选取 。 因 为 偏 移 地 址 总 是 要 求 从 0000H 开始 ， 而 82260H 
是 第 一 个 符合 该 条 件 的 物理 地 址 ， 因 为 它 恰 好 对 应 着 逻辑 地 址 
8226H:0000H ， 和 从 合 偏 移 地 址 的 条 件 ， 所 以 完全 可 以 将 段 地 址 定 为 
8226H 


但 是 ， 举 个 例子 来 说 ， 如 果 你 从 物理 内 存 地 址 82255H 处 加 载 程序 ， 
由 于 它 根 本 无 法 表示 成 一 个 偏 移 地 址 为 0000H 的 逻辑 地 址 ， 所 以 不 符合 
要 求 ， 段 不 能 从 这 里 开始 划分 。 这 里 面 的 区 别 在 于 ，82260H 可 以 被 十 进 
制 数 16 〈 或 者 十 六 进 制 数 10H) 整除 ， 而 82255H 不 能 。 通 过 这 个 例子 可 
以 看 出 ，8086 处 理 喜 的 馆 辑 分 段 ， 起 始 地 址 都 是 16 的 倍数 ， 这 称 为 是 
按 16 字 节 对 齐 的 。 


段 的 划分 是 目 由 的 ， 它 可 以 起 始 于 任何 16 字 节 对 齐 的 位 置 ， 也 可 以 
是 任意 长 度 ， 只 要 不 超过 64KB。 比 如 ， 段 地 址 可 以 是 82260H， 段 的 长 
上 度 可 以 是 64KB 。 在 这 种 情况 下 ， 该 段 所 对 应 的 馆 辑 地 址 范围 是 
8226H:0000H 一 8226H:FFFFH， 其 所 对 应 的 物理 地 址 范围 是 82260 一 
9225FH。 


同时 ， 正 古 由 于 段 的 划分 非 第 目 由 ， 使 得 8086 的 内 存 访问 也 非 第 随 
意 。 同 一 个 物理 地 址 ， 或 者 同一 片 内存 区 域 ， 根 据 需 要 ， 可 以 随意 指定 
一 个 段 来 访问 它 ， 前 提 是 那个 物理 地 址 位 于 该 段 的 64KB 范围 内 。 也 了 吏 是 
说 ， 同 一 个 物理 地 址 ， 实 际 上 对 应 看 多 个 远 辑 地 址 。 

检测 后 2.3 


1. INTEL 8086 处 理 器 有 ( ) 个 16 位 通用 寄存 器 ， 分 别 是 
( ) 。 其 中 ， 有 些 还 可 以 分 开 来 作为 两 个 独立 的 8 位 寄存 器 来 
用 ， 这 几 个 8 位 寄存 器 分 别 是 ( 二 

2. 选择 题 (可 多 选 ) : INTEL 8086 处 理 器 取 指 令 时 ， 使 用 段 寄 存 
器 〈 ) 和 指令 指针 寄存 器 〈 ) 。 方 法 是 ， 将 段 寄存 器 的 值 ( ) ， 加 上 指 
令 指 针 寄 存 器 的 当前 值 ， 形 成 物理 地 址 访问 内 存 。 

A.CS B.DS _ CIP D. 左 移 4 位 E. 右 移 4 位 F 乘 以 1 G. 除 以 
10H 


3. 物理 地 址 132FEH 对 应 的 逻辑 地 址 是 〈 可 多 选 ) : 


A.132FH:000EH B.1300H:02FEH 
C.1000H:32FEH D.1320H:00FEH 


E.102FH:03EOH F.UFEUH:34FEDH 


本 章 习 题 


1. 在 段 与 段 之 间 互 不 重 登 的 前 提 下 ，1MB 内 存 可 以 完整 地 划分 为 
多 少 个 16KB 的 段 ? 

2. 数据 段 寄存 器 DS 的 值 为 25BCH 时 ， 计 算 Intel 8086 可 以 访问 的 
物理 地 址 范围 。 


4 和 只、 五 二 
第 3 半 ”汇编 语言 和 汇编 软件 
处 理 喜 依靠 机 器 指令 工作 ， 但 机 器 指令 从 形式 上 看 都 是 一 些 没 有 规 
律 的 数字 ， 难 以 书写 、 阅 读 和 理解 ， 这 样 就 发 明了 汇编 语言 
标 是 : 
了 解 汇 编 语言 的 作用 和 “汇编 "一 词 的 由 来 


。 本章 的 目 
2. 下 载 NASM 编译 器 ， 并 


使 用 它 来 编译 汇编 语言 源 程序 


在 前 面 的 章节 里 ， 我 们 讲 到 了 处 理 器 ， 也 讲 了 处 理 器 是 如 何 进行 算 
术 氨 辑 运 算 的 。 为 了 实现 目 动 计算 ， 处 理 器 必须 从 内 存 中 取得 指令 ， 并 
执行 这 些 指令 。 

指令 和 被 指令 引用 的 数据 在 内 存 中 都 是 一 些 或 高 或 低 的 电 平 ， 每 一 
个 电 平 都 可 以 看 成 是 一 个 二 进 制 位 (0 或 者 1) ，8 个 二 进 制 位 形成 一 字 
I 

要 解读 内 存 中 的 东西 ， 最 好 的 办 法 就 是 将 它们 按 字 节 转 换 成 数字 的 
形式 。 比 如 ， 下 面 这 些 数 字 束 是 存放 在 内 存 中 的 INTEL8086 指令 ， 我 们 
用 的 是 十 六 进 制 : 


BE ° 00 90901 €3 0 €¢l 


对 于 大 多 数 人 来 说 ， 他 们 很 难 想 象 上 面 那 一 排 数 字 对 应 着 下 面 几 条 
8086 指令 : 


将 立即 数 003FH 传送 到 寄存 器 AX; 
将 寄存 器 BX 的 内 容 和 寄存 器 AX 的 内 容 相 加 ， 结 果 在 Bx 中 ; 
将 寄存 器 cX 的 内 容 和 寄存 器 AX 的 内 容 相 加 ， 结 果 在 cx 中 。 


即使 是 很 有 经 验 的 技术 人 员 ， 要 想 用 这 种 方式 来 编写 指令 ， 也 是 很 
困难 的 ， 而 且 很 容易 出 错 。 所 以 ， 在 第 一 个 处 理 需 诞生 之 后 不 入 ， 如 何 
使 指令 的 编写 变 得 更 容易 ， 束 提 上 了 日 程 。 

为 了 克服 机 器 指令 难以 书写 和 理解 的 缺点 ， 人 们 想到 可 以 用 一 些 容 
易 理 解 和 记忆 的 符号 ， 也 束 是 助 记 符 ， 来 朱 述 指令 的 功能 和 操作 数 的 类 
型 ， 这 就 产生 了 汇编 语言 (Assembly Language) 。 这 样 ， 上 面 那些 指 
令 就 可 以 写成 : 

me 区 ax, ER 


add bx,ax 


add cx,ax 


对 于 那些 有 点 英语 基础 的 人 来 说 ， 理 解 这 些 汇 编 语言 指令 并 不 困 
难 。 比 如 这 人 句 


mov ax,3FH 


首先 ，mov 是 move 的 简化 形式 ， 意 思 是 “移动 ”或 者 "传送 *。 至 于 
“ax”， 很 明显 ， 指 的 就 是 AX 寄存 器 。 传 送 指令 需要 两 个 操作 数 ， 分 别 是 
目的 操作 数 和 源 操 作 数 ， 它 们 之 则 要 用 逗号 隔 开 。 在 这 里 ，AX 是 目的 操 
作 数 ， 源 操作 数 是 3FH。 汇 编 语 言 对 指令 的 大 小 写 没 有 特别 的 要 求 。 所 
以 你 完全 可 以 这 样 写 : 


MOV AX,3FH 


mov GX, 3th 
MOV 吉文 38H 
mo AXx Sth 


在 很 多 珊 级 语言 中 ， 如 来 要 指示 一 个 数 古 十 六 进 制 数 ， 通 第 不 米 用 

在 后 面 加 "H” 的 做 法 ， 而 是 为 它 谎 加 一 个 "0x" 前缀。 像 这 样 : 
mo 石 文 0X 文 2 

你 可 能 起 问 一 下 ， 为 什么 会 是 这 样 ， 为 什么 会 是 "0X? 答 守 征 不 知 
道 ， 不 知 着 在 什么 时 候 ， 为 什么 了 驶 这 样 用 了 。 这 不 得 不 让 人 怀疑 ， 它 肯 
定 征 一 个 非 营 随意 的 决定 ， 并 在 以 后 形成 了 惯例 。 如 各 你 知 让 硝 切 的 答 
和 案 ， 不 妨 与 封 电 子 邮 件 告诉 我 。 注 意 ， 为 了 方便 ， 我 们 将 在 本 书 中 采用 
这 种 形式 。 

在 汇编 语言 中 ， 使 用 十 进 制 数 是 最 目 然 的 。 因 为 3FH 等 于 十 进 制 数 
63， 上 所 以 你 可 以 直接 这 样 与 : 


moy ax,63 
当然 ， 如 果 你 辟 欢 ， 也 可 以 使 用 二 进 制 数 来 这 样 与 : 


meow ax. O00LLL1ILIB 


一 定 要 看 清楚 ， 在 那 串 “0” 和 “1” 的 组 合 后 面 ， 跟 着 字母 ‘B”"， 以 表明 它 
是 一 个 二 进 制 数 。 


至 于 这 人 句 : 
add bx ,ax 


情况 也 是 一 样 。add 的 意思 是 把 一 个 数 和 男 一 个 数 相 加 。 在 这 里 ， 是 把 
BX 否 存 右 的 内 容 和 AX 寄存 亏 的 内 容 相 加 。 相 加 的 结 采 在 BX 中 ， 但 AX 
的 内 容 并 不 改变 。 

像 上 面 那 样 ， 用 汇编 语言 提供 的 符号 书写 的 文本 ， 叫 做 汇编 语言 产 
程序 。 为 此 ， 你 需要 一 个 字 处 理 絮 软件 ， 比 如 Windows 记事 本 ， 来 编辑 
这 些 内 容 。 如 图 3-1 所 示 ， 相 信 这 些 软件 的 使 用 都 是 你 已 经 非常 熟悉 的 。 


无 标题 - 记事 本 
文件 (F) 编辑 (日 “格式 (O) 查看 (V) 帮助 (H) 
mov ax, Ox3f 










add bx ax 
add cx, 


a 








图 3-1 用 Windows 记事 本 来 书写 汇编 语言 源 程序 


有 了 汇编 语言 所 提供 的 符号 ， 这 只 是 方便 了 你 自己。 相反 地 ， 对 人 
类 来 说 通俗 易 懂 的 东西 ， 处 理 嚣 是 无 法 识别 的 。 所 以 ， 还 需要 将 汇编 语 
言 源 程 序 转 换 成 机 器 指令 ， 这 个 过 程 叫 做 编译 (Compile) 。 在 编译 的 时 
候 ， 汇 编 语言 编译 器 的 作用 是 将 mov、add、ax、bx 等 这 些 符号 组 合 起 
来 ， 转 换 成 类 似 于 数值 的 机 右 指 令 ， 这 个 过 程 叫 做 站 编 ， 这 束 古 汇编 语 
言 的 由 来 ， 也 有 人 称 之 为 组 合 语言 。 

编译 肯定 还 需要 依靠 一 个 软件 ， 称 为 编译 右 ， 或 编译 软件 。 因 为 如 
果 需 要 人 类 目 己 去 做 ， 还 费 这 周 打 于 呆 。 另 一 方面 ， 想 想 看 ， 一 个 帮助 
人 类 生产 软件 的 工具 ， 自 己 居然 也 是 一 个 软件 ， 这 很 有 意思 。 


从 字 处 理 器 软件 生成 的 是 汇编 语言 源 程序 文件 。 编 译 软 件 的 任务 是 
读 取 这 些 文件 ， 将 那些 符号 转变 成 二 进 制 形 式 的 机 器 指令 代码 。 它 把 这 


些 机 器 代码 存放 到 另 一 个 文件 中 ， 叫 做 二 进 制 文件 或 者 可 执行 文件 ， 比 
如 Windows 里 以 “ exe" 为 扩展 名 的 文件 ， 束 是 可 执行 文件 。 当 需要 用 处 
理 琵 执行 的 时 候 ， 再 加 载 到 内 人 存 里 。 


3.2 NASM 编译 器 


3.2.1 NASM 的 下 载 和 安装 


每 种 处 理 器 都 可 能 会 有 自己 的 汇编 语言 编译 器 ， 而 对 于 同一 蒜 处 理 
器 来 说 ， 针 对 不 同 的 平台 (比如 Windows 和 Linux) ， 也 会 有 不 同 版 本 的 
汇编 语言 编 详 峰 。 

现存 的 汇编 语言 编译 器 有 多 种 ， 用 得 比较 多 的 有 MASM 、FASM、 
TASM、AS86、GASM 等 ， 每 种 汇编 器 都 有 目 己 的 特色 和 局 限 性 。 特 别 
是 ， 有 些 还 需要 付费 才能 使 用 。 不 同 于 前 面 所 列举 的 这 些 ， 在 本 书 中 ， 
我 们 用 的 是 另 一 款 叫 做 NASM 的 汇编 语言 编译 器 。 

NASM 的 全 称 是 Netwide Assembler， 它 是 可 免费 使 用 的 开源 软件 。 
下 面 是 它 的 下 载 地 址 : 


http://sourceforge.net/projects/nasm/files/ 


通过 以 上 地 址 可 以 找到 所 有 平台 上 的 NASM 版 本 ， 比 如 为 16 位 和 32 
人 DOS、LINUX、OS/2 等 操作 系统 开发 的 版 本 。 因 为 本 书 的 读者 一 般 在 
Windows 平台 上 工作 ， 所 以 应 当 使 用 下 和 面 的 链接 来 直接 定位 到 Windows 
平台 上 的 NASM 版 本 : 


http://sourceforge.net/projects/nasm/files/Win32%20binaries/ 


通过 以 上 链接 ， 可 以 显示 所 有 Windows 平台 上 的 NASM 版 本 ， 应 当 
选择 最 新 版 本 下 载 。 这 本 书 出 版 的 时 候 ， 最 新 的 NASM 版 本 是 2.07。 

本 书 不 配 光 盘 ， 所 以 书 中 的 所 有 源 代码 连同 我 白 己 写 的 小 工具 都 只 
有 通过 网 络 下 载 方 能 使 用 。 这 是 一 个 压缩 文件 ， 名 字 叫 booktool.zip， 可 
以 通过 下 面 这 个 链接 来 下 载 它 : 


http:/y/ishare.iask.sina.com en/f/34697012.html 


如 果 此 链接 不 可 用 ， 可 以 到 电子 工业 出 版 社 的 网 站 上 下 载 ， 或 者 直 
接 给 我 写 信 ， 我 会 以 最 快 的 时 间 给 予 文 持 。 


3.2.2 ”代码 的 书写 和 编译 过 程 


和 你 已 经 司空 见 惯 的 其 他 Windows 应 用 程序 不 同 ，NASM 在 运行 之 
后 并 不 会 显示 一 个 图 形 用 户 界 面 。 相 反 地 ， 它 只 能 通过 命令 行使 用 。 

比如 ， 我 们 可 以 用 Windows 记事 本 编写 一 个 汇编 语言 源 程 序 ， 并 把 
它 保存 到 NASM 工作 目录 下 “了 束 是 在 前 面 安 装 NASM 时 所 用 的 安装 文件 
来) ， 文 件 名 为 exam.asm。 作 为 惯例 ， 汇 编 语 言 源 程序 文件 的 扩展 名 是 
“asm”， 不 过 ， 你 当然 可 以 使 用 其 他 扩展 名 。 

一 旦 有 了 一 个 源 程 序 ， 下 一 步 束 是 将 它 的 内 容 编 译 成 机 器 代码。 为 
此 ， 可 以 从 Windows 开始 亲 单 里 找到 “Netwide Assembler xxx"， 其 中 的 
“xxx” 取 决 于 你 安装 的 NASM 版 本 。 然 后 ， 选 择 其 下 的 “Nasm Shel"， 这 
将 打开 一 个 命令 行 窗 口 。 

接着 ， 在 命令 行 提示 符 后 输入 “nasm -fbin exam.asm -o exam.bin” 
并 按 Enter 键 ， 如 图 3-2 所 示 。 





和 管理 员 : NASM Shell Ee XxX 
icroso ft Windows [版 本 6.1.7691] 
= 2069 Microso ft Corporation。 人 保留 所 有 权利 。 


C:\Program Files\NASM> 
C:\Program Files\NASM>nasm -f bin exam.asm -oO exam.bin 








图 3-2 在 命令 行 方式 下 使 用 NASM 编译 一 个 汇编 源 程序 


NASM 需要 一 系列 参数 才能 正常 工作 。-f 参数 的 作用 是 指定 输出 文 
件 的 格式 (Format) 。 这 样 ，-f bin 就 是 要 求 NASM 生成 的 文件 只 包含 
“ 纯 二 进 制 * 的 内 容 。 换 句 话说 ， 除 了 处 理 嚣 能够 识别 的 机 器 代码 外 ， 别 的 
任何 东西 都 不 包含 。 这 样 一 来 ， 因 为 缺少 操作 系统 所 需要 的 加 载 和 重 定 
位 信息 ， 它 就 很 难 在 Windows、DOS 和 Linux 上 作为 一 个 普通 的 应 用 程 
序 运行 。 不 过 ， 这 正 是 本 书 所 需要 的 。 

紧 接 看 ，exam.asm 是 源 程 序 的 文件 名 ， 它 是 将 要 被 编译 的 对 象 。 


-0 参数 指定 编译 后 输出 (Output) 的 文件 名 。 在 这 里 ， 我 们 要 求 
NASM 生成 输出 文件 exam.bin。 


用 来 编写 汇编 语言 源 程序 ，Windows 记事 本 并 不 是 一 个 好 工具 。 同 
时 ， 在 命令 行 编译 源 程序 也 令 很 多 人 迷糊 。 毕 葛 ， 很 多 年 轻 的 朋友 都 是 
用 着 Windows 成 长 起 来 的 ， 他 们 缺少 在 DOS 和 UNIX 下 工作 的 经 历 。 

为 了 写 这 本 书 ， 我 一 直 想 找 一 个 目 己 中 意 的 汇编 语言 编辑 软件 。 互 
联网 是 个 大 宝库 ， 上 面 有 很 多 这 样 的 工具 软件 ， 但 大 多 都 包含 了 太 多 的 
功能 ， 用 起 来 自然 也 很 复杂 。 我 的 愿望 很 简单 ， 能 够 方便 地 书写 汇编 指 
令 即 可 ， 同 时 还 具有 编译 功能 。 毕 葛 我 目 己 也 不 喜欢 在 命令 行 和 图 形 用 
户 界 面 之 间 来 回 切换 。 

在 经 历 了 一 系列 的 失望 之 后 ,我 决定 自己 写 一 个 ， 于 是 就 有 了 
Nasmide 这 个 小 程序 ， 它 同样 位 于 配 书 文件 包 中 。 不 过 遗憾 的 是 ， 这 个 
小 程序 却 并 非 是 用 汇编 语言 书写 的 。 

现在 ， 你 可 以 双击 nasmide.exe 来 运行 它 。 启 动 之 后 ， 如 图 3-3 所 
示 ，Nasmide 的 软件 界面 分 为 三 个 部 分 。 顶 端 是 菜单 ， 可 以 用 来 新建 文 
件 、 打 开 文 件 、 保 存 文 件 或 者 调用 NASM 来 编译 当前 文档 。 


针 4 Asm Editor-2011-11 [一 | 回放 机 
文件 (F) 选项 (QO) 说 明 (H) 














加 3-3 ”Nasmide 程序 的 基本 界面 


中 则 最 大 的 空 日 区 域 是 编辑 区 ， 用 来 书写 六 编 语 言 源 代位 。 

窗口 原 部 那个 罕 的 区 域 是 冰 明 显示 区 。 在 编 详 当前 文档 时 ， 不 省 是 
编 详 成 功 ， 还 是 友 现 了 文档 中 的 错误 ， 部 会 显示 在 这 里 。 

基本 上 ， 你 现在 已 经 可 以 在 Nasmide 里 书写 汇编 语 名 了。 不过， 在 
此 之 前 你 最 好 先 做 一 件 事情 。Nasmide 只 是 一 个 文本 编辑 工具 ， 它 自己 


没有 编译 能 力 。 不 过 ， 它 可 以 在 后 台 调 用 NASM 来 编译 当前 文档 ， 前 提 
是 它 必须 知道 NASM 安装 在 什么 地 方 。 

为 此 ， 你 需要 在 菜单 上 选择 "选项 ”一 "编译 环境 设置 "来 打开 如 网 3-4 
所 示 的 对 话 框 。 

如 图 3-4 所 示 ， 这 个 路 径 就 是 你 在 前 面 安 装 NASM 时 ， 指 定 的 安装 
路 径 ， 包 括 可 执行 文件 名 nasm.exe。 


不 同 于 其 他 汇编 语言 编译 器 ，NASM 最 让 我 喜欢 的 一 个 特点 是 允许 
在 源 程 序 中 只 包含 指令 ， 如 图 3-5 所 示 。 用 过 微软 公司 MASM 的 人 都 知 
站 ， 在 芮 正 开 始 书 与 汇编 指令 前 ， 允 要 罕 靴 戴 帽 ， 在 源 程 序 中 定义 很 多 
和 东西， 比如 代码 段 和 数据 段 等 ， 乔 了 半天 ， 实 际 上 连 一 条 指令 还 没 开 始 
与 呢 。 


选项 设置 





as 编译 

















图 3-4 ”为 Nasmide 指定 NASM 编译 器 所 在 路 径 

















$3 Asm Editor-2011-11 [ENIA32ASMNbooktoolvexam.asm] [一 | 器 二 
文件 (选项 (O) 说明 (H) | 
1 mov ax,Ox3f ;将 立即 数 传 送 到 ax 寄存 如 
2 add bx,ax 
3add Cx,ax 
| 
| * 
编译 完成 : 
EN\A32AShb 上 EN\IAI 有 上 











”图 3-5 ”NASM 允许 在 源 文件 中 只 包含 指令 


如 图 3-5 所 示 ， 用 Nasmide 程序 编辑 产程 序 时 ， 它 会 日 动 在 每 一 行 
内 容 的 左边 显示 行 写 。 对 于 初学 者 来 说 ， 一 开始 可 能 会 误 以 为 行 写 也 会 


出 现在 产程 序 中 。 不 要 误会 ， 行 号 并 非 源 程序 的 一 部 分 ， 当 保存 源 程 序 
的 时 候 ， 也 不 会 出 现在 文件 内 容 中 。 

让 Nasmide 显示 行 写 ， 这 是 一 个 聪明 的 决定 。 一 方面 ， 我 在 书 中 讲 
解 源 程序 时 ， 可 以 说 第 几 行 到 第 几 行 是 做 什么 用 的 ; 男 一 方面 ， 当 编译 
源 程 序 的 时 候 ， 如 果 发 现 了 错误 ， 错 误 信 息 中 也 会 说 明 是 第 几 行 有 错 。 
这 样 ， 因 为 Nasmide 显示 了 行 号 ， 这 就 很 容易 快速 找到 出 错 的 那 一 行 。 

在 汇编 源 程 序 中 ， 可 以 为 每 一 行 添 加 注释 。 注 释 的 作用 是 说 明 某 条 
指令 或 者 某 个 符号 的 含义 和 人 作用。 注释 也 是 源 程 序 的 组 成 部 分 ， 但 在 编 
译 的 时 候 会 被 编译 器 忽略 。 如 图 3-5 所 示 ， 为 了 告诉 编译 器 注释 是 从 哪里 
开始 的 ， 注 释 需要 以 英文 字母 的 分 号 "开始 。 

当 源 程序 书写 完毕 之 后 ， 束 可 以 进行 编译 了 了， 方法 是 在 Nasmide 中 
选择 菜单 “文件 ”一 “编译 本 文档 ”。 这 时 ，Nasmide 将 会 在 后 台 调 用 NASM 
来 完成 整个 编译 过 程 ， 不 需要 你 额外 操心 。 如 图 3-5 所 示 ， 即 使 只 有 三 行 
的 程序 也 能 通过 编译 。 编 译 完 成 后 ， 会 在 窗口 底部 显示 一 条 消息 。 

检测 点 3.1 


1. 在 你 的 计算 机 中 启动 Nasmide 程序 ， 输 入 图 3-10 中 的 三 行 代 
人 码 ， 然 后 编译 它们 。 看 看 消息 显示 区 是 否 有 编译 成 功 的 提示 。 

2. 选择 填空 : 指令 mov ax,0xf5fc 中 , “mov" 指 示 这 是 一 条 〈 ) 指 
令 ，0xf5fc 是 〈 ) 。 指 令 执 行 后 ， 寄 存 器 AX 中 的 内 容 是 ( ) 。 

A. 立 即 数 B. 传 送 C.0xf5fc D. 加 法 E.0xfcf5 F. 寄 存 器 


3.2.3 ”用 HexView 观察 编译 后 的 机 器 代码 


编译 成 功 完 成 之 后 ，Nasmide 会 在 编辑 窗口 的 确 部 显示 相应 的 消 
妃 ， 同 时 显示 了 源 文 件 名 称 和 编译 之 后 的 文件 名 称 〈 仿 路径) 。 


尽管 我 们 强调 源 文件 和 编译 之 后 的 文件 具有 不 同 的 内 容 ， 但 如 果 能 
用 工具 看 一 看 ， 相 信和 印象 更 为 深刻 。 在 前 面 下 载 的 配 书 源 码 和 工具 里 ， 
有 一 个 名 为 HexView 的 小 程序 ， 可 以 实现 这 个 愿望 。HexView 用 于 打开 
任意 一 个 文件 ， 以 十 六 进 制 的 形式 从 头 到 尾 显 示 它 每 个 字 节 的 内 容 。 


双击 局 动 HexView， 然 后 选择 来 单 " 文 件 一 打开 文件 以 最 示 "”， 在 文 
件 选择 对 话 框 里 找到 你 在 3.2.4 节 里 编辑 并 保存 的 源 程序 文件 。 


如 图 3-6 所 示 ， 文 件 选 择 之 后 ，HexView 程序 将 以 十 六 进 制 的 形式 
显示 刚刚 选择 的 文件 。 








00000000 6D 6F 76 20 61 78 2C 30 78 33 66 20 20 20 20 20 mov ax,0x3f 

00000010 20 20 20 20 20 20 20 20 20 20 20 3B BD MB Cl A2 7... 
00000020 BC B4 CA FD B4 MB CB CD BS BD 41 58 BC C4 B4 E6 .......... AX.... 
00000030 C6 F7 20 0D OA 61 64 64 20 62 78 2C 61 78 0D 0A .. ..add bx,ax.. | 
00000040 61 64 64 20 63 78 2C 61 78 add cx,ax 














图 3-6 ”用 HexView 程序 显示 源 程序 文件 的 内 容 


在 HexView 中 ， 文 件 的 内 容 以 十 六 进 制 的 形式 显示 在 窗口 中 间 ， 以 
16 个 字 节 为 一 行 ， 字 节 之 间 以 空白 分 隔 ， 所 以 看 起 来 很 稀 茧 。 如 果 文 件 
较 大 的 话 ， 则 会 分 成 很 多 行 。 


作为 对 照 ， 每 个 字 节 还 会 以 字符 的 形式 显示 在 窗口 右 侧 ， 如 果 它 确 
实 可 显示 为 一 个 字 从 的话。 如 末 访 字 市 并 非 一 个 可 以 显示 的 字 人 和 从， 则 显 
未 一 个 人 符 代 的 字符 “”“。 因 为 源 程 序 中 还 有 汉字 注释 ， 所 以 ， 如 果 细 心 的 
话 ， 从 图 中 可 以 算出 每 个 汉字 的 编码 是 两 个 字 节 ， 比 如 “将 ”* 字 的 编码 是 
0xBD 0xAB。 由 于 HexView 以 单字 布 的 形 陈 来 显示 每 个 字符 ， 所 以 无 法 
显示 汉字 。 

左边 的 数字 ， 是 每 一 行 第 一 个 字 节 相对 于 文件 头 部 的 距离 〈 偶 
移 ) ， CR 1 个 
子 和 全， 因此， 它 的 偏 移 量 是 00000000 (CH) ， 其 他 字符 以 此 类 推 ， 最 后 

个 字符 “Xx” 的 偏 移 量 是 00000048 (CH) 。 


源 程 序 很 长 ， 但 是 ， 编 详 之 后 的 机 融 指 令 却 很 刨 短 。 


如 图 3-7 所 示 ， 编 详 之 后 的 文件 只 有 7 个 字 节 ， 这 才 是 处 理 占 可 以 识 
别 并 执行 的 机 各 指令 


部 感人 铺 
本 号 由 


PE 
ss HexViewer-2011-11 [E:\IA32ASM\booktool\exam.bin] = [一 | GE XxX_ 





00000000 B8 3F 00 01 C3 01 cl1 











图 3-7 用 HexView 显示 编译 之 后 的 文件 内 容 


本 章 习 题 


如 图 3-6 所 示 ， 请 问 : 
(1) 源 程 序 共有 3 行 ， 每 一 行 第 一 个 字符 在 文件 内 的 偏 移 量 分 别 是 


多 小 ? 


S20 
(2) 该 源 程序 文件 的 大 小 是 多 少子 市 ? 


第 4 章 ”虚拟 机 的 安 小 和 使 用 


和 其 他 所 有 计算 机 语言 一 样 ， 汇 编 语言 程序 设计 具有 很 强 的 实践 
性 ， 不 实际 上 机 操作 ， 不 思考 ， 不 能 举一反三 ， 是 无 法 掌握 它 的 。 但 
是 ， 当 程序 编译 完成 后 ， 如 何 让 处 理 器 执行 它 呢 ?还 有 ， 如 何 才 能 知道 
执行 的 结果 是 不 是 正确 呢 ? 这 都 是 非常 重要 的 问题 ， 要 在 本 章 里 解决 。 
本 章 的 目标 是 : 

1. 了解 计算 机 的 开机 局 动 过 程 。 只 有 这 样 ， 你 才能 知道 我 们 应 当 把 
编译 好 的 程序 放 到 哪里 才 会 被 处 理 右 执行 到 。 

2. 了 解 人 硬盘 的 构造 和 作用 。 

3. 了 解 VirtualBox 虚拟 机 的 功能 ， 下 载 和 安装 VirtualBox 虚拟 机 软 
件 ， 创 建 一 台 本 书 中 要 用 到 的 虚拟 机 ， 学 会 往 虚 拟人 硬盘 中 写 数据 ， 和 学 会 
VirtualBox 虚拟 机 的 使 用 方法 。 


4.1 计算 机 的 启动 过 程 


4.1.1 ”如何 将 编译 好 的 程序 提交 给 处 理化 


对 于 绝 大 多 数 编 详 好 的 程序 来 说 ， 要 想得到 处 理 如 的 光顾 ， 让 它 执 
行 一 下 ， 必 须 借助 于 操作 系统 。 束 拿 Windows 来 说 ， 它 为 你 显示 每 个 程 
序 的 图 标 ， 人 允许 你 双击 来 运行 它们 。 在 内 部 你 看 不 见 的 层面 上 ， 它 必须 
给 将 要 运行 的 程序 分 配 空 用 的 内 和 存 空 间 ， 并 在 适当 有 的 时 候 将 程序 提交 给 
处 理 如 执行 。 

每 种 操作 系统 都 对 它 所 管理 的 程序 提出 了 种 种 格式 上 的 要 求 。 比 
如 ， 它 要 求 编 详 好 的 程序 必须 在 文件 的 开始 部 分 包含 编 详 日期， 是 针对 
哪 种 操作 系统 纺 详 的 ， 程 序 的 版 本 ， 第 一 条 指令 从 哪里 开始 ， 数 据 段 从 
哪里 开始 、 有 多 长 ， 代 人 码 段 从 哪里 开始 、 有 多 长 ， 等 等 ，Windows 其 全 
建议 你 在 文件 中 包含 人 至少 一 个 用 于 显示 的 图 标 。 如 果 你 不 按 它 的 要 求 
来 ， 它 也 不 会 给 你 面子 ， 并 下 帘 了 当地 弹出 一 个 对 话 框 ， 如 图 4-1 所 示 ， 
告诉 你 它 不 准备 ， 也 没 办 法 将 你 的 程序 提交 给 处 理 帮 。 


EIA32ASM\_E 文 部 分 \ 我 的 应 用 程序 :exe 笑 | 和 Ex) 










3 E:JA32ASMN 正 文部 分 \ 我 的 应 用 程序 .exe 不 是 有 效 的 Win32 应 用 程序 。 








LR 定 | 
图 4-1 每 种 操作 系统 部 会 定义 它 目 己 的 可 执行 文件 格式 


每 种 编译 器 都 有 能 力 针 对 不 同 的 操作 系统 来 生成 不 同 格式 的 二 进 制 
文件 ， 程 序 员 所 要 做 的 ， 就 是 在 源 程序 中 加 入 一 些 相 关 的 信息 ， 比 如 指 
定 每 个 段 的 开始 和 结束 ， 并 在 编译 时 指定 适当 的 参数 。 如 果 你 对 此 感 兴 
趣 ， 可 以 阅读 NASM 文档 。 这 是 一 个 PDF 文件 ， 在 安装 NASM 的 时 候 ， 
它 也 会 被 安装 。 

在 特定 的 操作 系统 上 开发 软件 肯定 不 是 一 件 容 易 的 事情 。 但 换个 角 
度 考 虑 一 下 ， 操 作 系 统 也 是 一 个 需要 在 处 理 右 上 运行 的 软件 ， 只 不 过 比 
起 一 般 的 程序 而 言 ， 体 积 更 为 庞大 ， 功 能 更 为 复杂 而 已 。 如 果 我 们 能 经 
过 它 ， 或 者 代 蔡 它 ， 让 计算 机 一 开机 的 时 候 直 接 执行 我 们 目 己 的 软件 ， 
也 不 更 简单 ? 





好 ， 这 个 主意 完全 可 行 。 屠 就 让 我 们 慢 慢 开始 吧 。 
4.1.2 ”计算 机 的 加 电 和 复位 


在 处 理 器 众多 的 引 脚 中 ， 有 一 个 是 RESET， 用 于 接受 复位 信号 。 每 
当 处 理 右 加 电 ， 或 者 RESET 引 脚 的 电 平 由 低 变 高 时 和 ， 处 理 塔 都 会 执行 
一 个 人 硬件 初始 化 ， 以 及 一 个 可 选 的 内 部 目测 试 (Build-in Self-Test， 
BIST，〉，， 然 后 将 内 部 所 有 和 寄存 右 的 内 容 急 始 到 一 个 预 置 的 状态 。 


比如 ， 对 于 Intel 8086 来 说 ， 复 位 将 使 代码 段 寄 存 器 (CS) 的 内 容 
为 0xFFFF， 其 他 所 有 寄存 孝 的 内 容 都 为 0Xx0000， 包 括 指令 指针 寄存 亏 
(CIP) 。8086 之 后 的 处 理 需 并 未 延续 这 种 设计 ， 但 军 无 疑问 ， 无 论 怎 么 
设计 ， 都 是 有 目的 的 。 

处 理 鼎 的 主要 功能 是 取 指 令 和 执行 指令 ， 加 电 或 者 复位 之 后 ， 它 就 
会 立刻 尝试 去 做 这 样 的 工作 。 不 过 ， 在 这 个 时 候 ， 内 存 中 还 没有 任何 有 
意义 的 指令 和 数据 ， 它 该 怎么 办 呢 ? 

在 揭 开 谜底 之 前 ， 我 们 先 来 看 看 内 存 的 特点 。 


为 了 而 约 成 本 ， 并 提高 容量 和 集成 度 ， 在 内 存 中 ， 每 个 比特 的 存储 
都 是 靠 一 个 极其 微小 的 晶体 党， 外 加 一 个 同样 极其 微小 的 电容 来 完成 
的 。 可 以 想象 ， 这 样 微 小 的 电容 ， 其 汇源 电 厨 的 速 肛 当 然 也 非常 快 。 所 
以 ， 个 人 计算 机 中 使 用 的 内 存 需 要 定期 种 充电 伍 ， 这 称 为 刷新 ， 所 以 这 
种 存储 喜 也 称 为 动态 随机 访问 存储 豆 (Dynamic Random Access 
Memory，DRAM) 。 随 机 访问 的 意思 是 ， 访 问 任 何 一 个 内 存单 元 的 速度 
和 它 的 位 置 (地 址 ) 无 关 。 举 个 例子 来 说 ， 从 头 至 尾 在 一 盘 录 音 市 上 找 
东 首 歌曲 ， 它 越 靠 前 ， 找 到 它 所 花 的 时 间 台 越 得。 但 内 存 束 不 一 样 ， 谍 
写 地 址 为 0x00001 的 内 存单 元 ， 和 读 写 地 址 为 0xFFFF0 的 内 存单 元 ， 所 
需要 的 时 间 是 一 样 的 。 


在 内 存 刷 新 期 间 ， 处 理 此 将 无 法 访问 它 。 这 还 不 是 最 证 烦 的 ， 最 肝 
烦 的 是 ， 在 它 断 电 之 后 ， 所 有 保存 的 内 容 都 会 统统 消失 。 上 所 以 ， 每 当 处 
理 厚 加 电 之 后 ， 扰 无 法 从 内 存 中 取得 任何 指令 。 


4.1.3 基本 输入 输出 系统 


Intel 8086 可 以 访问 1MB 的 内 存 空 间 ， 地 址 苑 围 为 0x00000 到 
0xFFFFF。 出 于 各 方面 的 考虑 ， 计 算 机 系统 的 设计 者 将 这 1MB 的 内 存 空 
间 从 物理 上 分 为 几 个 部 分 。 

8086 有 20 根 地 址 线 ， 但 并 非 全 都 用 来 访问 DRAM， 也 就 是 内 存 条 。 
事实 上 上， 这些 地 址 线 经 过 分 配 ， 大 部 分 用 于 访问 DRAM， 剩 余 的 部 分 给 
了 只 谈 存 储 需 ROM 和 外 围 的 板 卡 ， 如 图 4-2 所 示 。 


FOO000-FFFFF 


地 址 分 
四 


00000-9FFFF “要 





图 4-2 8086 系统 的 内 存 空间 分 配 


与 DRAM 不 同 ， 只 读 存 储 器 (Read Only Memory，ROM ) 不 需要 
刷新 ， 它 的 内 容 是 预先 写 入 的 ， 即 使 挥 电 也 不 会 消失 ， 但 也 很 难 改变 。 
这 个 特点 很 有 用 ， 比 如 ， 可 以 将 一 些 程 序 指令 固化 在 ROM 中 ， 使 处 理 器 
在 每 次 加 电 时 都 自动 执行 。 处 理 器 醒 来 后 不 能 狐 着 ， 这 是 很 重要 的 。 

在 以 Intel 8086 为 处 理 器 的 系统 中 ，ROM 占据 着 整个 内 存 空间 顶端 
的 64KB， 物 理 地 址 范围 是 0xF0000~0xFFFFF， 里 面 固化 了 开机 时 要 执 
行 的 指令 ; DRAM 占据 着 较 低 端的 640KB ， 地 址 范围 是 0x00000 一 
0x9FFFF; 中 间 还 有 一 部 分 ， 分 给 了 其 他 外 围 设 备 ， 这 个 以 后 再 说 。 
为 8086 加 电 或 者 复位 时 ，CS=0xFFFF，IP=0x0000， 所 以 ， 它 取 的 第 一 
条 指令 位 于 物理 地 址 0xFFFF0， 正 好 位 于 ROM 中 ， 那 里 固化 了 开机 时 需 
要 执行 的 指令 。 

处 理 器 取 指 令 执 行 的 自然 顺序 是 从 内 存 的 低地 址 往 高 低地 址 推进 。 
如 果 从 0xFFFF0 开始 执行 ， 这 个 位 置 离 1MB 内 存 的 顶端 (物理 地 址 
0xFFFFF) 只 有 16 个 字 节 的 长 度 ， 一旦 IP 寄存 器 的 值 超过 0x000F， 比 
如 IP=0x0011， 那 么 ， 它 与 CS 一 起 形成 的 物理 地 址 将 因为 盗 出 而 变 成 
0x00001， 这 将 回 绕 到 1MB 内 存 的 最 低 端 。 


所 以 ，ROM 中 位 于 物理 地 址 0xFFFF0 的 地 方 ， 通 常 是 一 个 跳 转 指 
令 ， 它 通过 改变 CS 和 IP 的 内 容 ， 使 处 理 器 从 ROM 中 的 较 低 地 址 处 开始 
取 指 令 执 行 。 在 NASM 汇编 语言 里 ， 一 个 典型 的 跳 转 指 令 像 这 样 : 


Jmp Oxf000:0xe05b 


在 这 里 ，“jmp” 古 跳 转 Jump》 的 人 简化 形式 ;0xf000 是 要 跳 转 到 的 段 
地 址 ， 用 来 改变 CS 寄存 器 的 内 容 ; 0xe05b 是 目标 代码 段 内 的 偏 移 地 
址 ， 用 来 改变 IP 寄存 器 的 内 容 。 因 此 ， 目 标 位 置 的 物理 地 址 是 0xfe05b。 
一 旦 执行 这 条 指令 ， 处 理 器 将 开始 从 指定 的 “ 段 : 偶 移 "处 开始 重新 取 指 令 
执行 。 

到 了 本 书 第 5 章 我 们 束 能 接触 跳 转 指令 了 ， 现 在 ， 我 们 只 需要 知道 ， 
指令 的 执行 并 非 上 中古 顺序 的 ， 有 时 候 不 得 不 根据 菜 些 条 件 来 选择 执行 哪 
些 指令 ， 不 执行 哪些 指令 。 这 个 时 候 ， 跳 转 指令 是 很 有 用 的 。 

这 块 ROM 蕊 片 中 的 内 容 包 括 很 多 部 分 ， 主 要 是 进行 硬件 的 诊断 、 检 
测 和 初始 化 。 所 谓 初 始 化 ， 就 是 让 硬件 处 于 一 个 正常 的 、 默 认 的 工作 状 
态 。 最 后 ， 它 还 负责 提供 一 套 软 件 例 程 ， 让 人 们 在 不 必 了 解 硬件 细节 的 
情况 下 从 外 围 设备 (比如 键盘 〉 获取 输入 数据 ， 或 者 回 外 转变 备 《 比 如 
显示 占 ) 输出 数据 。 设 备 当然 是 很 多 的 ， 所 以 这 块 ROM 必 卢 只 针对 那些 
最 基本 的 、 对 于 使 用 计算 机 而 言 最 重要 的 设备 ， 而 它 所 提供 的 软件 例 
程 ， 也 只 包含 最 基本 、 最 常规 的 功能 。 正 因为 如 此 ， 这 块 蕊 片 又 叫 基 本 
输入 输出 系统 (Base Input & Output System，BIOS) ROM。 在 读者 缺 
乏 基础 知识 的 情况 下 讲述 ROM-BIOS 的 工作 只 会 越 讲 越 糊 涂 ， 所 以 这 些 
知识 将 会 分 散在 各 个 章节 里 予以 讲解 。 

ROM-BIOS 的 容量 是 有 限 的 ， 当 它 完 成 目 己 的 使 命 后 ， 最 后 所 要 做 
的 ， 残 是 从 辅助 存储 设备 谈 取 指令 数据 ， 然 后 转 到 那里 开始 执行 。 基 本 
上 ， 这 相当 于 接力 完 中 的 交接 棒 。 


4.1.4 人 硬盘 及 其 工作 原理 


历史 上 ， 有 多 种 辅助 存储 设备 ， 比 如 软盘 、 光 盘 、 人 硬盘 、U 盘 等 ， 
相对 于 内 存 ， 它 们 束 是 人 们 律 说 的 "外 存 "， 即 外 存储 器 (设备 ) 。 

从 软盘 〈Floppy Disk) 局 动 计算 机 ， 这 已 经 是 过 去 的 事 了 了 。 软 盘 的 
尺寸 比 烟 盒 稍 大 一 点 ， 但 是 比较 注 ， 采 用 塑料 作为 基 片 ， 上 面 是 一 层 破 


性 物质 ， 可 以 用 来 记录 三 进 制 位 。 这 种 塑料 介质 比较 柔软 ， 所 以 称 为 软 
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在 数据 记录 原理 上 和 软盘 很 相似 的 设备 是 便 盘 (Hard Disk ， 
HDD) ， 而 县 它们 世 注 征 风 一 个 时 代 的 产物 。 但 是 ， 与 软盘 不 同 ， 人 硬盘 
是 多 盘 片 、 密 封 、 高 转速 的 ， 采 用 铝 合 金 作 为 基 片 ， 并 在 表面 涂 上 磁性 
物质 来 记录 二 进 制 位 。 这 了 束 使 得 它 的 盘 片 具有 较 高 的 硬度 ， 故 称 为 便 
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如 图 4-3 所 示 ， 这 是 一 块 被 拆 开 的 硬 
盘 ， 中 间 是 用 于 记录 数据 的 铝 合金 盘 片 ， 固 日 
定 在 中 心 的 轴 上 ， 由 一 个 高 速 旋转 的 马达 驱 前 
动 。 附 着 在 盘 片 表面 的 扁平 锥 状 物 ， 就 是 用 
于 在 盘 片 上 读 写 数据 的 磁头 。 

为 了 进一步 搞 清 起 硬盘 的 内 部 构造 ， 图 肝 让 xs 全 
4-4 给 出 了 更 为 详细 的 网 示 。 久 

时 个 得 片 (这 称 为 单 
碟 ) ， 也 可 能 有 好 几 个 盘 片 。 但 无 论 如 何 ， 图 4.3 一 块 钻 拆 开 密封 盖 的 硬盘 
ee hdd 个 轴 上 ， 由 电动 机 带动 着 一 
起 蜗 速 放 转 。 一 般 来 说， 转速 可 以 达到 每 分 钟 3600 转 或 者 7200 转 ， 有 的 

能 达到 一 万 多 转 ， 这 个 参数 束 是 我 们 稼 说 的 "“ 转 /分 钟 ”(Round Per 


时 次 RPM) 。 
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图 4-4” 便 盘 的 结构 示意 图 


每 个 盘 片 都 有 两 个 磁头 (Head) ， 上 耐 一个， 下 耐 一个， 所 以 经 常 
用 磁头 来 指 代 盘 面 。 磁 头 者 有 编号 ， 第 1 个 盘 户 ， 上 面 的 磁头 编号 为 0， 
下 面 的 磁头 编号 为 1， 第 2 个 盘 户 ， 上 面 的 磁头 编 志 为 2， 下 面 的 磁头 纺 
写 为 3， 以 此 类 推 。 


每 个 磁头 不 是 单独 移动 的 。 相 反 ， 它 们 都 通过 磁头 臂 固定 在 同一 个 
文 桨 上 ， 由 步 进 电动 机 带动 着 一 起 在 盘 上 族 的 中 心 和 边缘 之 间 来 回 移 动 。 
也 束 是 说 ， 它 们 是 同 进退 的 。 步 进 电 动机 由 脉冲 驱动 ， 每 次 可 以 旋转 一 
个 固定 的 角度 ， 即 可 以 步 进 一 次 。 

可 以 想象 ， 当 盘 片 高 速 旋转 时 ， 磁 头 每 步 进 一 次 ， 都 会 从 它 所 在 的 
位 置 开始 ， 统 着 圆心 “ 男 " 出 一 个 看 不 见 的 圆圈 ， 这 就 是 人 磁道 (Track) 。 
位 道 是 数据 记录 的 轨迹 。 因 为 所 有 磁头 都 是 联动 的 ， 故 每 个 盘面 上 的 同 
一 条 人 磁道 又 可 以 形成 一 个 虚拟 的 圆柱 ， 称 为 柱 面 (Cylinder) 。 


伐 道 ， 或 者 柱 面 ， 也 要 编号 。 纺 十 从 盘面 最 边缘 的 那 条 倍 直 开 
始 ， 问 看 圆心 的 方 同 ， 从 0 开始 编写 。 


柱 面 是 一 个 用 来 优化 数据 谈 写 的 概念 。 初 看 起 来 ， 用 使 盘 来 记录 数 
据 时 ， 应 该 先 将 一 个 盘面 填 满 后 ， 再 填写 太一 个 盘面 。 实 际 上 ， 移 动 破 
头 古 一 个 机 械 动 作 ， 看 似 很 快 ， 但 对 人 处理 右 来 说 ， 却 很 漫长 ， 这 束 十 寻 
轧 时 间 。 为 了 加 速 数据 在 价 盘 上 的 读 写 ， 最 好 的 办 法 不是 尽量 个 移动 倍 
头 。 这 梓 ， 当 0 面 的 人 磁 达 个 四 以 容纳 要 写 入 的 数据 时 ， 应 当 把 镜 余 的 部 分 
写 在 1 面 的 同一 磁 站 上 。 如 琳 还 与 不 下 ， 那 吏 继 续 把 剩余 的 部 分 与 在 2 面 
的 同一 磁道 上 。 换 名 话说， 在 硬盘 上 ， 数 据 的 访问 是 以 柱 面 来 组 织 的 。 

实际 上 ， 人 和 倒 道 还 不 是 便 熏 数据 读 与 的 最 小 单位 ， 做 道 还 要 进一步 划 
分 为 届 区 (Sector) 。 侯 违 很 罕 ， 也 看 不见， 但 在 想象 中 ， 它 仍 呈 市 
状 ， 皇 有 一 定 的 宽度 。 将 它 划 分 许多 分 段 之 后 ， 每 一 部 分 都 呈 届 形 ， 这 
束 定 而 区 的 由 来 。 

每 条 人 磁道 能 够 划分 为 几 个 而 区 ， 取 决 于 磁盘 的 制造 者 ， 但 通 第 为 63 
个 。 而 且 ， 每 个 而 区 部 有 一 个 编号， 与 似 尖 和 磁道 人 不同， 届 区 的 编写 是 
从 1 开始 的 。 


局 区 与 而 区 之 间 以 间 际 〈 空 日 ) 间 隅 开 来 ， 每 个 局 区 以 司 区 头 开 
始 ， 然 后 是 512 个 字 节 的 数据 区 。 届 区 头 包含 了 每 个 局 区 自己 的 信息 ， 
主要 有 本 出 区 的 磁道 三 、 磁 头号 和 刷 区 号 ， 用 来 供 人 硬盘 定位 机 构 使 用 。 
现代 的 硬盘 还 会 在 忆 区 头 部 包括 一 个 指示 忆 区 是 否 健康 的 标志 ， 以 及 用 
来 将 换 该 夯 区 的 忆 区 地 址 。 用 于 化 换 忆 区 的 ， 是 一 至 傈 留 和 隐藏 的 做 
道 。 


4.1.5 一 切 从 主 引 导言 区 开始 


尽管 我 们 使 用 硬盘 的 历史 很 长 ， 但 它 一 直 没 能 退出 舞台 ， 这 主要 是 
因为 它 总 能 通过 不 断 提 高 目 己 的 容量 来 打败 那些 竞争 者 。20 世纪 90 年 代 
初 ，40MB 的 便 租 算是 币 见 的 ， 能 拥有 200MB 的 硬盘 很 让 人 天 桶 。 看 看 
现在 ，500GB 的 硬盘 也 不 算 稀 军 ， 而 且 价 钱 也 很 便宜 。 


前 面 说 到 ， 当 ROM-BIOS 完成 自己 的 使 命 之 前 ， 最 后 要 做 的 一 件 事 
是 从 外 存储 设备 读 取 更 多 的 指令 来 交 给 处 理 堪 执行 。 现 实 的 情况 是 ， 缀 
大 多 数 时 候 ， 对 于 ROM-BIOS 来 说 ， 硬 盘 都 是 首选 的 外 存储 设备 。 

人 硬盘 的 第 一 个 面 区 是 0 面 0 道 1 面 区 ， 或 者 说 是 0 头 0 柱 1 面 区 ， 这 
个 届 区 称 为 主 引 导 届 区 。 如 果 计 算 机 的 设置 是 从 硬盘 启动， 那么 ，ROM.- 
BIOS 将 读 取 人 硬盘 主 引 导 忆 区 的 内 容 ， 将 它 加 载 到 内 存 地 址 
0x0000:0x7c00 处 〈 也 就 是 物理 地 址 0x07C00) ， 然 后 用 一 个 jmp 指令 
跳 到 那里 接 痢 执行 : 

jmp 0x0000:0x7c00 

为 什么 偏偏 是 0x7c00 这 个 地 方 ? 还 不 太 清 楚 。 反 正当 初 定 下 这 个 方 
案 的 家 伙 已 经 被 人 说 了 很 多 坏话 ， 我 也 就 不 准备 再 多 说 什么 了 。 

通常 ， 主 引导 局 区 的 功能 是 继续 从 硬盘 的 其 他 部 分 读 取 更 多 的 内 容 
加 以 执行 。 像 Windows 这 样 的 操作 系统 ， 束 是 采用 这 种 接力 的 方法 一 步 
一 步 把 自己 运行 起 来 的 。 

说 到 这 里 ， 我 们 可 以 想象 ， 如 果 我 们 把 自己 编译 好 的 程序 写 到 主 引 
导 扇 区 ， 不 也 能 够 让 处 理 器 执行 吗 ? 

对 于 这 种 想法 ， 我 有 一 个 好 消息 和 一 个 坏 消息 要 告诉 你 。 

好 消息 是 ， 这 是 可 以 的 ， 而 且 这 几乎 是 在 不 依赖 操作 系统 的 情况 
下 ， 让 我 们 的 程序 可 以 执行 的 唯一 方法 。 

不 过 ， 坏 消息 是 ， 如 条 你 改写 了 硬盘 的 主 引 导 面 区， 那么 ， 
Windows 和 Linux， 以 及 任何 你 正在 使 用 的 操作 系统 都 会 肉 病 ， 无 法 局 动 
了 。 

那么 ， 我 们 该 怎么 办 呢 ? 答案 是 在 你 现 有 的 计算 机 上 ， 再 虚拟 出 一 
台 计 算 机 来 。 

检测 点 4.1 


1 硬盘 的 磁头 〈 盘 面 ) 是 从 数字 〈 ) 开始 编号 的 ， 每 个 盘面 磁道 
是 从 数字 〈 ) 开始 编号 的 ， 每 磁道 / 柱 面 上 的 肩 区 是 从 数字 〈 ) 开始 编号 
的 ， 主 引导 扇 区 的 位 置 是 ( ) 面 ( ) 道 ( ) 肩 区 ; 


2. 如 果 和 希望 处 理 喜 从 当前 位 置 转移 到 物理 地 址 0xc5030 处 开始 执 
行 ， 可 以 使 用 下 面 的 哪些 指令 〈 可 多 选 ) : 


A.JImp Oxc000:0x5030 B. jmp Oxc500:0x0030 
C. jmp Oxc503:0x0000 D. jmp Oxbb00:0xa030 


4.2 创建 和 使 用 虚拟 机 


4.2.1 别 害怕 ， 虚 拟 机 是 软件 


对 于 第 一 次 昕 说 虚拟 机 (Virtual Machine，VM) 的 人 来 说 ， 可 能 以 
为 还 要 再 花 钱 买 一 台 计 算 机 ， 这 恐 介 是 他 们 最 担心 的 。 所 谓 虚 拟 机 ， 束 
是 在 你 的 计算 机 上 再 虚拟 出 另 一 台 计 算 机 来 。 这 人 台 虚 拟 出 来 的 计算 机 ， 
和 真正 的 计算 机 一 样 ， 可 以 启动 ， 可 以 关 团 ， 还 可 以 安装 操作 系统 、 安 
装 和 运行 各 种 各 样 的 软件 ， 或 者 访问 网 络 。 总 之 ， 你 在 真实 的 计算 机 上 
能 做 什么 ， 在 它 里 面 一 样 可 以 那么 做 。 使 用 虚拟 机 ， 你 会 发 现 ， 在 
Windows 操作 系统 里 ， 居 然 又 可 以 拥有 男 一 套 Windows。 人 然而 本 质 上 ， 
它 只 是 运行 在 物理 计算 机 上 的 一 个 软件 程序 。 

如 图 4-5 所 示 ， 整 个 大 的 背景 ， 是 Windows 7 的 桌面 ， 它 安装 在 一 
台 真 实 的 计算 机 上 。 图 中 的 小 窗口 ， 正 是 虚拟 机 ， 运 行 的 是 Windows 
Server 2003。 像 这 样 ， 我 们 束 得 到 了 两 台 “ 计 算 机 ”， 而 且 它 们 都 可 以 操 
1 医 


虚拟 机 仅仅 是 一 个 软件 ， 运 行 在 各 种 主流 的 操作 系统 上 。 它 以 目 己 
运行 的 芮 实 计算 机 为 模板 ， 虚 拟 出 万 一 套 处 理 右 、 内 存 和 外 围 设 备 来 。 
它 的 处 理 能 力 ， 完 全 来 目 于 背后 那 全 真实 的 计算 机 。 

尤其 重要 的 是 ， 针 对 某 种 真实 处 理 器 所 写 的 任何 指令 代码 ， 通 党 都 
可 以 正确 无 误 地 在 该 处 理 占 的 虚拟 机 上 执行 。 实 际 上 ， 这 也 是 虚拟 机 具 
有 广 沁 应 用 价值 的 原因 所 在 。 





图 4-5 ”虚拟 机 的 实例 


在 过 去 的 右 干 年 里 ， 虚 拟 机 得 到 了 广泛 应 用 。 为 了 人 研制 防 病 毒 软 
件 、 测 斌 最 新 的 操作 系统 或 者 软件 产品 ， 软 件 公司 通 帅 需 要 多 台 用 于 做 
实验 的 计算 机 。 采 用 虚拟 机 ， 束 可 以 避免 反复 重 竣 软件 系统 的 抹 烦 ， 妆 
这 些 软件 系统 朋 浊 时 ， 毅 误 的 只 是 虚拟 机 ， 而 真实 的 物理 计算 机 丝 坚 不 


le 
受 影 啊 。 


利用 虚拟 机 来 教学 ， 本 书 不 是 第 一 个 ， 国 丹 外 都 流行 这 种 教学 方 
却 。 虚 拟 机 利用 软件 来 模拟 完整 的 计算 机 系统 ， 无 须 添 加 任何 新 的 设 
备 ， 而 且 与 主 计算 机 系统 是 隔离 的 ， 在 虚拟 机 上 的 任何 操作 都 不 会 影响 
到 物理 计算 机 上 的 操作 系统 和 软件 ， 这 对 拥有 大 量 计算 机 的 培训 机 构 来 
说， 可 以 极 大 地 太 管 维护 上 的 成 本 。 


4.2.2 下载 和 安装 Oracle VM VirtualBox 


主流 的 虚拟 机 软件 包括 VMWare、Virtual PC 和 VirtualBox 等 ， 但 只 
有 VirtualBox 是 开源 和 人 免费 的 。 


要 使 用 VirtualBox， 首 先 必 须 从 网 上 和 下载 并 安装 它 。 这 里 是 它 的 主 


httpes//Wwwe virtualboxoorg/ 


退 过 这 个 主页 ， 你 可 以 找到 最 新 的 版 本 并 下 载 它 。 为 了 了 方便， 下面 
给 出 下 载 页 面 的 链接 : 


https://www.virtualbox.org/wiki/Downloads 


本 书 的 配 书 文件 包 中 提供 了 关于 如 何 下 载 、 安 装 和 配置 VirtualBox 软 
件 的 文档 ， 有 WORD 和 PDF 两 种 版 本 ， 请 选择 使 用 。 注 意 ， 要 选择 了 最 新 
的 版 本 下 载 ， 而 且 ， 由 于 该 软件 针对 不 同 的 操作 系统 平台 开发 ， 因 此 ， 
要 下 载 适 用 于 Windows 的 安装 程序 。 


VirtualBox 软件 安 闭 完毕 之 后 ， 你 需要 创建 ， 或 者 说 “虚拟 "出 一 合计 
算 机 来 ， 并 设置 该 “计算 机 "的 相关 参数 ， 包 括 为 它 配 备 一 块 便 盘 。 有 关 的 
方法 和 步骤 在 配 书 文件 包 的 教程 中 已 有 介绍 ， 唯 一 的 建议 是 选用 本 书 为 
你 准备 的 虚拟 硬 检 。 


和 真实 的 计算 机 一 样 ， 虚 拟 机 也 需要 一 个 或 几 个 辅助 存储 占 【〈 们 _ 
盘 、 光 盘 、U 一 等 ) 才能 工作 。 不 过 ， 为 它 配 备 的 并 非 真正 的 盘 片 ， 而 
是 一 个 特殊 的 文件 ， 故 称 为 虚拟 盘 。 这 样 ， 当 一 个 软件 程序 在 虚拟 机 里 
读 与 便 租 或 者 光盘 时 ， 虚 拟 机 将 把 它 转 换 成 对 文件 的 操作 ， 而 软件 程序 
还 以 为 自己 真 的 是 在 读 写 物理 盘 片 。 这 样 的 一 块 人 磁盘， 在 需要 的 时 候 随 
时 创建 ， 不 需要 时 可 以 随时 删除 ， 这 真是 非 党 神奇 的 人 磁盘。 


前 面 你 已 经 从 网 上 下 载 了 与 本 书 配套 的 源码 和 工具 ， 那 是 个 压缩 文 
件 。 解 压 之 后 ， 在 源 代 人 码 和 工具 文件 夹 里 有 一 个 现成 的 虚拟 人 硬 检 文件 ， 
文件 名 是 LEECHUNG.VHD， 这 是 给 你 额外 准备 的 ， 而 且 经 过 了 测试 ， 
可 以 在 你 无 法 创建 虚拟 人 硬盘 的 时 候 派 上 用 场 。 不 管 是 你 自己 创建 虚拟 人 硬 
可 ， 还 是 选用 这 个 现成 的 ， 都 应 当 使 虚拟 人 硬盘 文件 位 于 源 代 人 码 所 在 的 文 
件 夹 ， 将 来 往 该 虚拟 硬盘 写 数据 时 比较 方便 。 


正如 前 面 所 说 的 ， 市 面 上 有 好 几 种 流行 的 虚拟 机 软件 ， 而 每 种 虚拟 
机 软件 都 企图 制定 目 己 的 虚拟 便 盘 标准 。 因 为 虚拟 便 盘 实际 是 一 个 文 
件 ， 所 以 ， 所 谓 虚 拟 便 盘 标 准 ， 实 际 上 就 是 该 文件 的 格式 。 正 是 因为 这 
样 ， 虚 拟人 硬盘 类 型 说 日 了 束 是 你 准备 米 用 哪 家 的 虚拟 便 盘 文件 格式 。 


因为 虚拟 便 稚 实际 上 是 一 个 文件 ， 所 以 ， 通 党 来 说 ， 它 的 格式 体现 
在 它 的 文件 扩展 名 上 。 比 如 上 面 的 LEECHUNG.VHD， 采 用 的 就 是 微软 
公司 的 VHD 虚拟 人 硬盘 规范 。VHD 规范 最 早起 源 于 Connectix 公司 的 虚拟 
机 软件 Connectix Virtual PC ，2003 年 ， 微 软 公 司 收 购 了 它 并 改名 为 
Microsoft Virtual PC。2006 年 ， 人 微软 公司 正式 发 布 了 VHD 虚拟 硬 柱 格式 
规范 。 在 本 书 配套 的 源 代 码 和 工具 包 里 ， 有 该 规范 的 文档 。 

VDI 是 VirtualBox 目 己 的 虚拟 便 盘 规范 ，VMDK 是 VMWare 的 虚拟 
便 盘 规范 。 采 用 哪个 公司 、 哪 个 虚拟 机 软件 的 虚拟 硬 舟 格 式 ， 对 于 普通 
的 应 用 来 说 ， 这 没什么 关系 ， 它 们 都 能 很 好 地 工作 。 但 是 ， 对 于 本 书 和 
本 书 配 套 的 工具 来 说 ， 你 必须 选择 “VHD (Virtual Hard Disk) ”。 具 体 原 
因 ， 我 们 将 在 下 一 节 讲 述 。 

事实 上， 即使 是 VHD， 也 分 为 两 种 类 型 : 固定 尺寸 的 和 动态 分 配 
的 。 一 个 固定 尺寸 的 VHD， 它 对 应 的 文件 尺寸 和 该 虚拟 硬盘 的 容量 是 相 
同 的 ， 或 者 说 是 一 次 性 分 配 够 了 的 。 比 如 ， 一 个 2GB 的 VHD 虚拟 硬盘 ， 
它 对 应 的 文件 大 小 也 是 2GB。 注 意 ， 本 书 以 及 本 书 配套 的 工具 仅 文 持 回 
定 尺 寸 的 VHD。 


一 旦 完成 了 全 部 的 准备 工作 ， 刚 刚 创建 的 虚拟 机 就 会 显示 在 
VirtualBox 控制 合 里 ， 如 图 4-6 所 示 ， 虐 拟 机 的 名 字 叫 LEARN-ASM”。 基 
本 上 ， 你 现在 就 可 以 单 击 控制 台 界 面 上 的 “开始 "来 启动 这 台 虚 拟 机 。 但 
是 ， 别 忙 ， 你 的 虚拟 硬盘 里 还 没有 东西 呢 。 
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图 4-6 ”通过 向 导 程序 创建 的 LEARN-ASM 虚拟 机 
4.2.3 ”虚拟 硬盘 简介 


坦 日 地 说 ， 之 所 以 要 米 用 固定 尺寸 的 VHD 虚拟 合租 ， 古 因为 其 傈 单 
性 。 我 们 知道 ， 虚 拟人 硬盘 实际 上 有 是 一 个 文件 。 固 定 太 十 的 VHD 虚拟 人 硬盘 
是 一 个 具有 ".vhd" 扩 展 名 的 文件 ， 它 仪 包括 两 个 部 分 ， 前 和 面 是 数据 区 ， 用 
来 模拟 实际 的 价 盘 空间 ， 后 面 跟 看 一 个 512 子 市 的 结尾 (2004 年 前 的 规 
范 里 只 有 511 字 节 ) 。 


要 访问 硬 和 是， 运行 中 的 程序 必须 至 少 同 便 盘 控 制 莫 提供 4 个 参数 ， 分 
列 是 磁头 号 、 倍 道 写 、 刷 区 号 ， 以 及 访问 意图 〈 和 是 读 还 是 写 ) 。 

人 惕 盘 有 的 读 写 古 以 山区 为 最 小 持 位 有 的。 所 以 ， 无 论 什 么 时 候 ， 要 从 僻 
盘 读 数据 ， 或 者 问 使 盘 与 数据 ， 至 少 得 是 1 个 局 区 。 

你 可 能 想 ， 我 只 有 2 字 节 的 数据 ， 不 足以 填 满 一 个 忆 区 ， 怎 么 办 呢 ? 


这 是 你 自己 的 事 。 你 可 以 用 无 意义 的 废 数字 来 填充 ， 凑 够 一 个 肩 区 
的 长 度 ， 然 后 写 入 。 读 取 的 时 候 也 是 这 样 ， 你 需要 自己 跟踪 和 把 握 从 遍 
区 里 读 到 的 数据 ， 哪 些 是 你 真正 想 要 的 。 换 名 话说， 硬盘 只 是 机 械 和 电 


子 的 组 合 ， 它 不 会 天 心 你 都 写 了 至 什么 。 要 是 于 机 像 人 类 一 样 贸 能 ， 它 
一 定 会 在 坏人 使 用 它 的 时 候 无 法 开机 。 


在 VHD 规范 里 ， 每 个 而 区 是 512 VHD 文件 一 开始 的 512 字 
节 ， 就 对 应 着 物理 硬盘 的 0 面 0 道 1 扇 区 。 然 后 ，VHD ee 
字 节 ， 对 应 着 0 面 0 道 2 局 区 ， 后 面 的 以 此 类 推 ， 一 直 对 应 到 0 面 0 道 
而 区 。 这 里 ，n 等 于 每 磁道 的 局 区 数 。 

再 往 后 ， 因 为 硬盘 的 访问 是 按 柱 面 进行 的 ， 所 以 ， 在 VHD 文件 中 ， 
紧 接 着 前 面 的 数据 块 ， 下 一 个 数据 块 对 应 的 是 1 面 0 道 1 忆 区， 就 这 样 一 
直 往 后 排列 ， 当 把 第 一 个 柱 面 全 部 对 应 完 后 ， 再 从 第 二 个 柱 面 开始 对 


如 图 4-7 所 示 ， 为 了 标志 一 个 文件 是 VHD 格 却 的 虚拟 硬盘 es 
用 它 的 虚拟 机 提供 该 硬盘 的 参数 ， 在 VHD 文件 的 结尾 ， 包含 了 512 字 
的 格式 信息 。 为 了 观察 这 些 信 息 ， 我 们 使 用 了 前 面 已 经 介绍 过 的 配 书 工 
具 HexView。 


如 图 4-7 所 示 ， 文 件 尾 信 息 是 以 一 个 字符 串 "conectix 开 始 的 。 这 个 
标志 用 来 告诉 试图 打开 它 的 虚拟 机 ， 这 的 确 是 一 个 合法 的 VHD 文件 。 该 
标志 称 为 VHD 创建 者 标识 ， 束 是 说 ， 访 公司 (conectix) 创建 了 VHD 文 
件 格 式 的 最 初 标 准 。 
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图 4-7 VHD 文件 的 格式 信息 








从 这 个 标志 开始 ， 后 面 的 数据 包含 了 诸如 文件 的 创建 日 期 、VHD 的 
版 本 、 创 建 该 文件 的 应 用 程序 名 称 和 版 本 、 创 建 该 文件 的 应 用 程序 所 属 
的 操作 系统 、 该 虚拟 硬盘 的 参数 (人 磁头 数 、 每 面 磁 道 数 、 每 磁道 户 区 
数 ) 、VHD 类 型 (固定 尺寸 还 是 动态 增长 〉、 虚 拟 便 稚 容 量 等 。 


襄 到 这 里 ， 也 许 你 已 经 明日 我 为 什么 要 在 书 中 使 用 国定 尺寸 的 
VHD。 是 的 ， 因 为 它 人 简单 。 为 了 学 习 汇 编 语 言 ， 我 们 不 得 不 在 便 礁 上 下 
接 写 入 程序 。 因 为 VHD 格 陈 人 简单， 所 以 我 只 花 了 很 少 的 时 间 束 开 肥 了 一 
个 虚拟 硬盘 写 入 程序 ， 作 为 配 书 工具 让 大 家 使 用 ， 这 束 是 下 一 节 将 要 介 
绍 的 FixVhdWr。 


至 于 为 什么 要 使 用 VirtualBox 虚拟 机 ， 和 是 因为 它 文 持 VHD， 而 且 是 
免费 的 。 先 前 版 本 的 VirtualBox 可 以 识别 VHD， 但 不 文 持 创 建新 的 
VHD， 尺 管 微 软 公 司 很 早 束 公开 了 VHD 规范 。 好 消息 是 现在 的 
VirtualBox 也 可 以 创建 VHD 了 。 


4.2.4 ”练习 使 用 FixVhdWr 工具 向 虚拟 硬盘 写 数 据 


通常 ，VHD 是 由 虚拟 机 VirtualBox 使 用 的 。 应 用 程序 像 往 常 一 样 ， 
直接 针对 便 盘 进行 控 作 ， 而 在 故 层 ， 虚 拟 机 将 这 些 便 件 访问 转化 为 对 文 
件 的 读 写 。 

为 了 在 处 理 器 加 电 或 者 复位 之 后 能 够 执行 我 们 写 的 程序 ， 势 必要 将 
这 些 程序 写 到 硬盘 的 主 引导 局 区 里 ， 也 就 是 0 面 0 道 1 扇 区 ， 即 使 是 在 虚 
拟 机 工作 环境 中 ， 也 是 这 样 。 

为 了 做 到 这 一 点 ， 需 要 一 个 专门 针对 虚拟 硬盘 进行 读 写 的 工具 。 我 
目 己 写 了 一 个 ， 束 在 配 书 源 代 码 和 工具 里 ， 名 叫 FixVhdWr。 

FixVhdWr 只 针对 国定 尺寸 的 VHD。 当 它 启 动 之 后 ， 首 先 需 要 选择 要 
读 写 的 VHD 文件 。 如 图 4-8 所 示 ， 一 旦 这 是 个 合法 的 VHD 文件 ， 它 将 读 
取 该 文件 的 结尾 ， 并 显示 该 虚拟 硬盘 的 信息 。 

注意 ， 因 为 FixVhdWr 只 针对 国定 尺寸 的 VHD， 所 以 ， 如 果 它 检测 到 
该 VHD 是 一 个 动态 虚拟 硬盘， 则 "下 一 步 ? 按 钮 处 于 禁止 状态 。 

第 二 步 是 选择 要 写 入 虑 拟人 硬盘 的 数据 文件 。 毕 葛 ， 在 任何 操作 系统 
中 ， 数 据 都 是 以 文件 的 方式 组 织 的 ， 如 图 4-9 所 示 。 


最 后 一 个 界面 ， 是 执行 写 入 操作 ， 如 图 4-10 所 示 ， 你 应 该 选择 第 一 
种 写 入 方式 ， 即 “LBA 连续 直 写 模式 "， 并 指定 起 始 的 逻辑 局 区 号 。 


3 Vhd Writer-2011-11 一 | 回 恒 芝 而 








虚拟 硬盘 : C: \Users\Administrator\VirtualBox VMSs\LEARN-ASM\LEARN-ASM.vhd 


本 : 04.01 
该 虚拟 磁盘 创建 于 2011-12-19 10:33:27。 
945 个 柱 面 ; 13 个 磁头 ; 六 17 个 肩 区 。 
总 容量 为 102 MB ( 兆 字 节 
Came 文件 大 小 不 变 ) 。 














选择 虚拟 硬盘 文件 8) [下 一 步 aD | [退出 | 


图 4- 8 打 : 开 VHD 文件 并 显示 该 虚拟 硬盘 的 信息 












[ers pp 
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数据 文件 : E:\IA32ASNM\booktoo0l\exan. bin 





图 4-9 选择 要 写 入 虚拟 硬盘 的 文件 
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@ LBA 连 续 直 写 模 式 
起 始 LBA 肩 区 号 : 0 





BB 文件 系统 模式 





| 写 六 文件 人 了) 





数据 写 入 完成 ， 本 次 共 操 作 了 1 个 扇 区 。 


| 完成 (Q) 


图 4-10 ”指定 数据 写 入 时 的 起 始 逻 辑 届 区 写 


通常 ， 一 个 局 区 的 尺寸 是 512 字 节 ， 可 以 看 成 一 个 数据 块 。 所 以 ， 
从 这 个 意义 上 来 说 ， 人 硬盘 是 一 个 典型 的 块 (Block) 设备 。 


采用 磁头 、 厂 道 和 忆 区 这 种 模式 来 访问 硬盘 的 方法 称 为 CHS 模式 ， 
但 不 是 很 方便 。 想 想 看 ， 如 果 有 一 大 堆 数 据 要 写 ， 还 得 注意 磁头 号 、 破 
道 号 和 局 区 号 不 要 超过 界限 。 所 以 ， 后 来 引入 了 逻辑 块 地 址 (Logical 
Block Address，LBA) 的 概念 。 现 在 市 场 上 销售 的 硬盘， 无 论 是 哪个 广 
家 生产 的 ， 都 文 持 LBA 模式 。 


LBA 模式 是 由 人 硬盘 控制 右 在 便 件 一 级 上 提供 支持 ， 所 以 效率 很 高 ， 
兼容 性 很 好 。LBA 模式 不 考虑 扇 区 的 物理 位 置 〈 磁 头号 、 磁 道 号 ) ， 而 
是 把 它们 全 部 组 织 起 来 统一 编号 。 在 这 种 编 址 方式 下 ， 原 先 的 物理 而 区 
被 组 织 成 逻辑 忆 区 ， 且 都 有 唯一 的 逻辑 而 区 号 。 

比如 ， 某 人 硬盘 有 6 个 磁头 ， 每 面 有 1000 个 磁道， 每 磁道 有 17 个 局 
区 。 那 么 : 


远 辑 0 局 区 对 应 看 0 面 0 道 1 局 区 ; 
逻辑 1 局 区 对 应 看 0 面 0 道 2 局 区 : 





逻辑 16 局 区 对 应 看 0 面 0 道 17 局 区 ; 
逻辑 17 局 区 对 应 看 1 面 0 道 1 而 区 : 
逻辑 18 局 区 对 应 看 1 面 0 道 2 局 区 ; 


远 辑 33 而 区 对 应 着 1 面 0 道 17 局 区 ; 
人 馆 辑 34 而 区 对 应 着 2 面 0 道 1 局 区 ; 
人 馆 辑 35 而 区 对 应 着 2 面 0 道 2 而 区 ; 


要 注意 到 ， 忆 区 在 编号 时 ， 是 以 柱 面 为 单位 的 。 即 ， 先 是 0 面 0 道 ， 
接着 是 1 面 0 道 ， 直 到 把 所 有 盘面 上 的 0 磁道 处 理 完 ， 再 接着 处 理 下 一 个 
柱 面 。 之 所 以 这 样 做 ， 是 因为 我 们 讲 过 ， 要 加 速 便 盘 的 访问 速度 ， 最 好 
是 尽 可 能 不 移动 磁头 。 

因为 这 里 总 共有 102000 个 而 区 ， 故 最 后 一 个 逻辑 而 区 的 编写 是 
101999， 它 对 应 着 5 面 999 道 17 面 区 ， 这 也 是 整个 便 盘 上 最 后 一 个 物理 

这 里 面 的 计算 方法 是 : 

LBA = Cx 人 磁头 总 数 x 每 道 鹿 区 数 十 瓦 x 每 道 扇 区 数 十 (S 一 1) 

这 里 ，LBA 是 逻辑 扇 区 号 ，C、H、S 是 想 求 得 逻辑 扇 区 号 的 那个 物 
理 扇 区 所 在 的 磁道 、 磁 头 和 扇 区 号 。 

采用 LBA 模式 的 好 处 是 简化 了 程序 的 操作 ， 使 得 程序 员 不 用 关心 数 
据 在 硬盘 上 的 具体 位 置 。 对 于 本 书 来 说 ，VHD 文件 是 按 LBA 方式 组 织 
的 ， 一 开始 的 512 字 节 就 是 逻辑 0 面 区 ， 然 后 是 逻辑 1 而 区 ; 最 后 一 个 多 
辑 届 区 排 在 文件 的 最 后 (最 后 512 个 字 节 除外 ， 那 是 VHD 文件 的 标识 部 
I 

检测 点 4.2 

1. 运行 NASMIDE 程序 ， 输 入 以 下 汇编 指令 并 保存 为 文件 4- 
2.asm (不 要 考虑 这 些 指令 的 含义 和 功能 

mov ax,0xb800 

mov ds,ax 

mov [0x00],a 


mov [Ox021],Ss 


mov [Ox04], m 

jmp $ 

2. 将 上 面 的 4-2.asm 文件 编译 ， 得 到 二 进 制 文件 4-2.bin， 并 写 入 虚 
拟人 硬盘 的 主 引 导 忆 区 。 注 意 ， 访 虚拟 便 舟 应 当 是 VirtualBox 虚拟 机 的 启动 
便 檀 。 

3. 启动 你 的 VirtualBox 虚拟 机 。 当 虚拟 机 启动 时 ， 会 像 真 实 的 计算 
机 一 样 加 载 硬 盘 上 的 主 引 导 局 区 代码 ， 并 执行 。 此 时 ， 注 意 观 察 屏 薪 上 
都 显示 了 什么 内 容 。 


[1] 比如 ， 当 你 按 下 主机 箱 面 板 上 的 RESET 按钮 时 ， 就 会 导致 RESET 引 脚 电 平 的 变 
化 ， 从 而 使 计算 机 热 启动 。 





第 2 部 分 “ 实 模 陈 


用 5 革 的 篇 幅 ， 从 多 个 角度 展现 8086 处 理 融 分 段 内 存 访问 的 特 
彻底 理解 分 段 的 本 质 。 


学 习 过 程 调 用 、 栈 、 中 断 和 外 围 设备 访问 的 技术 。 
了 解 操 作 系 统 加 载 用 户 程序 并 实施 重 定 位 的 一 般 原 理 。 
学 会 用 Bochs 虚 拟 机 调试 程序 。 


- 


第 5 章 ”编号 主 引 导 属 区 代码 


在 学习 汇编 语言 程序 设计 时 ， 如 果 结 合共 体 的 实例 来 和 学习， 把 汇编 
拉 术 融入 解决 一 些 具体 的 问题 当中 ， 将 能 获得 很 好 的 学 习 效 来 。 


已 学 者 在 写 第 一 个 程序 时 ， 都 有 一 种 在 屏幕 上 显示 点 什么 的 想法 ， 
这 是 很 正常 的 ， 可 以 理解 ， 因 为 屏 娶 是 最 直观 的 ， 能 够 看 出 程序 的 运行 
是 否 正 常 ， 是 否 符合 设计 时 的 预期 。 为 此 ， 本 章 将 带 你 了 解 如 何 控制 显 
卡 在 屏幕 上 显示 守 符 。 当 然 ， 这 并 不 是 主要 目的 ， 真 正 的 目的 在 于 用 这 
个 具体 的 实例 ， 让 你 学 习 到 以 下 知识 : 

1. NASM 汇编 语言 源 程序 的 一 般 组 成 部 分 ， 如 标号 、 指 令 、 伪 指 
令 和 注释 等 。 

2. 进一步 学 习 mov 指令 和 jmp 指令 的 更 多 用 法 ， 以 及 加 法 指令 
add、 除 法 指令 div 和 异 或 指令 xor 的 用 法 。 

3. 处 理 如 的 工作 是 取 指 令 、 执 行 指 令 ， 包 括 数 据 访 问 。 而 这 一 切 ， 
都 是 通过 分 段 机 制 来 完成 的 。 在 本 章 中 ， 通 过 编号 程序 、 分 析 程 序 的 执 
行 过 程 ， 观 察 程序 的 执行 结果 ， 进 一 步 加 深 对 内 存 分 段 访问 机 制 的 感性 
认识 和 对 处 理 器 工作 过 程 的 理解 。 


5.1 本章 代码 清单 





5.2 ”欢迎 来 到 主 引导 局 区 


在 前 面 的 预备 知识 里 ， 我 们 已 经 知道 ， 处 理 器 加 电 或 者 复位 之 后 ， 
如 果 人 硬盘 是 首选 的 启动 设备 ， 那 么 ，ROM-BIOS 将 试图 读 取 硬盘 的 0 面 0 
道 1 而 区 。 传 统 上 ， 这 束 是 主 引 导 届 区 (Main Boot Sector，MBR) 。 


谈 取 的 主 引导 忆 区 数据 有 512 字 节 ，ROM-BIOS 程序 将 它 加 载 到 远 
辑 地 址 0x0000:0x7c00 处 ， 也 就 是 物理 地 址 0x07c00 处 ， 然 后 判断 它 是 否 
有 效 。 

一 个 有 效 的 主 引导 刷 区 ， 其 最 后 两 字 节 应 当 是 0x55 和 0xAA。ROM- 
BIOS 程序 首先 检测 这 两 个 标志 ， 如 果 主 引导 扇 区 有 效 ， 则 以 一 个 段 间 转 
移 指令 jmp 0x0000:0x7c00 跳 到 那里 继续 执行 。 

一 般 来 说 ， 主 引导 忆 区 是 由 操作 系统 负责 的 。 正 篆 情 况 下 ， 一 段 精 
心 编 写 的 主 引 导 届 区 代码 将 检测 用 来 局 动 计 算 机 的 操作 系统 ， 并 计算 出 
它 所 在 的 便 盘 位 置 。 然 后 ， 它 把 操作 系统 的 目 举 代码 加 载 到 内 存 ， 也 用 
jmp 指令 跳 转 到 那里 继续 执行 ， 直 到 操作 系统 完全 局 动 。 

在 本 章 中 ， 我 们 将 试 狗 写 一 段 程序 ， 把 它 编 译 之 后 写 入 硬盘 的 主 引 
导 届 区， 然后 让 处 理 器 执行 。 当 然 ， 仅 仅 执 行 还 不 够 ， 还 必须 在 屏幕 上 
显示 点 什么 ， 要 不 然 的 话 ， 谁 知道 我 们 的 程序 是 不 是 成 功 运行 了 呢 ? 

通过 本 章 的 学 习 ， 我 们 可 以 对 处 理 器 如 何 执行 指 令 、 如 何 访问 内 存 
以 及 如 何 进 行 算 术 逻 辑 运 算 有 一 个 最 基本 的 认 知 。 


5.3 注 释 


如 本 章 代码 清单 5-1 所 展示 的 那样 ， 在 汇编 语言 源 程序 里 ， 注 释 用 于 
说 明 本 程序 的 用 途 和 编写 时 间 等 ， 可 以 单独 成 行 ， 也 可 以 放 在 每 条 指令 
的 后 面 ， 解 释 本 指令 的 目的 和 功能 。 注 释 不 但 有 助 于 其 他 编程 人 员 理解 
当前 程序 的 编写 思路 和 工作 原理 ， 而 且 也 能 帮助 你 自己 在 以 后 的 某 个 时 
间 重 拾 这 些 记忆 ， 

注释 必须 以 英文 字母 开始。 


在 源 程 序 编译 阶段 ， 编 译 器 将 忽略 所 有 注释 。 因 此 ， 在 编译 之 后 ， 
这 些 和 生成 机 卓 代 人 码 无 天 的 内 容 部 统统 消失 了 了 。 


5.4 在 屏幕 上 显示 文字 


5.4.1 显卡 和 显存 


本 程序 首先 要 做 的 事 古 在 屏幕 上 显示 一 行文 字 。 当 然 ， 要 外 在 屏 基 
上 蛇 示 文字 ， 了 束 希 要 和 多 了 解 文字 是 如 何 显示 在 屏 医 上 的 。 

为 了 蛙 示 文字 ， 通 种 需要 两 种 便 件 ， 一 是 显示 卉 ， 二 是 显卡 。 显 卡 
的 职 贡 古 为 显示 帮 近 供 内 容 ， 并 控制 显示 占 的 显示 模式 和 和 状态， 显示 融 
的 职 贡 是 将 那些 内 容 以 视 沉 可 见 的 万 式 呈 现在 屏 帮 上 。 

一 般 来 说 ， 显 卡 部 十 独立 生产 、 销 售 的 部 件 ， 需 要 插 在 主板 上 才能 
工作 。 当 然 ， 像 处 理 融 、 内 和 存 这 样 的 东西 ， 也 位 于 主板 上 。 每 台 计 算 机 
都 有 主板 ， 它 就 在 机 箱 内 部 ， 有 时 间 你 可 以 打开 机 箱 来 观察 一 下 。 


当然 ， 显 卡 未 必 一 定 是 独立 的 插 卡 。 为 了 节省 使 用 者 的 成 本 ， 有 的 
显卡 会 直接 做 在 主板 上 ， 这 样 的 显卡 也 有 个 名 字 ， 叫 集成 显卡 。 

显卡 控制 显示 需 的 最 小 单位 是 像素 ， 一 个 像 际 对 应 看 屏 蔗 上 的 一 个 
点 。 屏 从 上 通常 有 数 十 万 乃至 更 多 的 像素 ， 通 过 控制 每 个 像素 的 明暗 和 
硕 色 ， 我 们 融 能 让 这 大 量 的 像素 形成 文字 和 美丽 的 图 像 。 

不 过 ， 一 个 很 容易 想到 的 问题 是 ， 如 何 来 控制 这 些 像素 呢 ? 

答案 是 显卡 都 有 目 己 的 存储 器 ， 因 为 它 位 于 显卡 上 ， 故 称 显示 存储 
器 (Video RAM: VRAM ) ， 简 称 显存 ， 要 显示 的 内 容 都 预先 写 入 显 
人 存 。 和 其 他 半导体 存储 需 一 样 ， 显 存 并 没有 什么 特殊 的 地 方 ， 也 是 一 个 
按 字 节 访 问 的 存储 器 件 。 

对 显示 喜来 说 ， 显 示 黑 白 图 像 是 最 简单 的 ， 因 为 只 需要 控制 每 个 像 
素 是 亮 ， 还 是 不 亮 。 如 果 把 不 亮 当 成 比特 “0"”， 亮 看 成 比特 “人 ， 那 就 好 办 
了 。 因 为 ， 只 要 将 显存 里 的 每 个 比特 和 显示 器 上 的 每 个 像素 对 应 起 来 ， 
就 能 实现 这 个 目标 。 

如 图 5-1 所 示 ， 显 存 的 第 1 个 字 节 对 应 着 屏 薪 左上 角 连 续 的 8 个 像 
素 ; 第 2 个 字 节 对 应 着 屏幕 上 后 续 的 8 个 像素 ， 后 面 的 以 此 类 推 。 


显存 显示 耸 


00002 00000000 
00001 DAL Llul 
00000 11110000 


图 5-1 显存 内 容 和 显示 器 内 容 之 间 的 对 应 关系 


显卡 的 工作 是 周期 性 地 从 显存 中 提取 这 些 比 特 ， 并 把 它们 按 顺 序 显 
示人 在 屏 秦 上 。 如 末 是 比特 “0”"， 则 像 系 你 持原 来 的 状态 个 变 ， 因 为 屏 舌 本 
来 束 是 黑 的 ; 如 于是 比特 “1”， 则 点 党 对 应 的 像 系 。 


继续 观察 图 5-1， 假 设 显 存 中 ， 第 1 个 字 节 的 内 容 是 11110000， 和 第 2 
个 字 节 的 内 容 是 11111111， 其 他 所 有 的 字 节 都 是 00000000。 在 这 种 情况 








扩 。 因 为 像 系 是 案 控 在 一 起 的 ， 所 以 我 们 看 到 的 先是 一 条 日 短线 ， 隔 看 
一 定 距 离 (4 个 像素 ) 又 是 一 条 日 长 线 。 


黑色 和 和 白色 只 需要 1 个 比特 就 能 表示 ， 但 要 显示 更 多 的 颜色 ，1 个 比 
特 就 不 够 了 。 现 在 最 流行 的 ， 是 用 24 个 比特 ， 即 3 个 字 节 ， 来 对 应 一 个 
像 系 。 因 为 224=16777216， 所 以 在 这 种 模式 下 ， 同 屏 可 以 显示 
16777216 种 颜色 ， 这 称 为 真 彩色 。 有 关 颜 色 的 显示 和 它们 与 字 长 的 关 
系 ， 在 《 罕 越 计算 机 的 迷 私 》 一 书 中 有 详细 的 介绍 ， 这 里 不 再 疆 述 。 

上 面 所 讨论 的 ， 是 人 们 和 常 说 的 图 形 模式 。 图 形 模 式 是 最 容易 理解 
的 ， 同 时 对 显示 器 来 说 也 是 最 自然 的 模式 。 

现在 是 图 形 的 时 代 ， 束 连 手机 的 屏幕 都 是 五 彩 缤纷 的 。 时 光 倒 退 到 
几 十 年 前 ， 在 那个 时 代 ， 真 彩色 还 没有 出 现 ， 显 示 器 只 能 提供 有 限 的 色 
彩 ， 处 理 器 也 不 够 强劲 (以 今天 的 眼光 来 看 ) 。 在 这 种 情况 下 ， 人 们 不 
太 可 能 认为 图 形 显 示 技 术 有 多 么 重要 ， 因 为 他 们 不 看 高 清 电 影 ， 也 没有 
数码 相机 ， 用 计算 机 制作 动画 片 更 是 不 能 想象 的 事 。 那 个 时 候 ， 人 们 的 
愿望 很 简单 ， 只 要 能 显示 文字 就 行 。 


不 管 是 显示 图 片 ， 还 是 文字 ， 对 显示 器 来 说 没有 什么 不 同 ， 因 为 所 
有 的 内 容 都 是 由 像素 组 成 的 ， 区 别 仅仅 在 于 这 些 像素 组 成 的 是 什么 。 有 
时 候 ， 人 们 会 说 ， 哦 ， 显 示 的 是 一 棵 树 ， 有 时 候 ， 人 们 会 说 ， 哦 ， 显 示 
的 是 一 个 字母 "H" 


问题 是 ， 操 作 显 存 里 的 比特 ， 使 得 屏 如 上 能 显示 出 字符 的 形状 ， 是 
非常 国 烦 、 非 党 繁重 的 工作 ， 因 为 你 必须 计算 该 字符 所 对 应 的 比特 位 于 
显存 里 的 什么 位 置 。 


为 了 方便 ， 工 程 师 们 想 出 了 一 个 办 法 。 束 像 一 个 二 进 制 数 既 可 以 是 
一 个 普通 的 数 ， 也 可 以 代表 一 条 处 理 器 指令 一 样 ， 他 们 认为 每 个 字符 也 
可 以 表示 成 一 个 数 。 比 如 ， 数 字 0x4C 就 代表 字符 “L”"， 这 个 数 被 称 为 是 字 
符 “ 呈 "的 ASCI 代码， 后面 会 讲 到 。 

如 图 5-2 所 示 ， 可 以 将 字符 的 代码 存放 到 显存 里 ， 第 1 个 代码 对 应 着 
屏幕 左上 角 第 1 个 字符 ， 第 2 个 代码 对 应 着 屏幕 左上 和 角 第 2 个 字符 ， 后 面 
的 以 此 次 推 。 剩 下 的 工作 是 如 何 用 代码 来 控制 屏幕 上 的 像 孙 ， 使 它们 或 
明 或 瞳 以 构成 字符 的 轮廓 ， 这 是 字符 发 生 右 和 控制 电路 的 事情 。 

传统 上 ， 这 种 专门 用 于 显示 字符 的 工作 方式 称 为 文本 模式 。 文 本 模 
式 和 图 形 模式 是 显卡 的 两 种 基本 工作 模式 ， 可 以 用 指令 访问 显卡 ， 设 置 
它 的 显示 模式 。 在 不 同 的 工作 模式 下 ， 显 卡 对 显存 内 容 的 解释 是 不 同 
的 。 
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Ne 1 | 
1 1 
a Y 
了 全 Hello 
i141! 

中 1 1 1 

1 1 1 
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字符 | 的 代码 |----* 1 
字符 e 的 代码 上 |----: 
字符 H 的 代码 上 -----: 


图 5-2 ”字符 在 屏 基 上 的 显示 原理 
为 了 给 出 要 显示 的 字符 ， 处 理 套 需要 访问 显存 ， 把 字符 的 ASCII 码 


写 进 去 。 但 是 ， 显 存 是 位 于 显卡 上 的 ， 访 问 显 存 需 要 和 显卡 这 个 外 围 设 
备 打交道 。 同 时 ， 多 一 道 手 续 目 然 是 不 好 的 ， 这 当中 节 重 要 的 考量 是 速 





度 和 效率 。 想 想 看 ， 你 让 人 传 话 给 父母 ， 和 目 己 莱 目 往 家 里 打 电 话 ， 伦 
费 的 时 间 古 不 一 样 的 。 为 了 实现 一 些 快速 的 游戏 动画 效果 ， 或 者 播放 噩 
码 率 的 电影 ， 不 直接 访问 显存 是 办 不 到 的 。 


为 此 ， 计 算 机 系统 的 设计 者 们 ， 这 些 敢 想 敢 和 干 的 人 人， 决定 把 显存 映 
射 到 处 理 器 可 以 直接 访问 的 地 址 空间 里 ， 也 就 是 内 存 空间 里 。 

如 图 5-3 所 示 ， 我 们 知道 ，8086 可 以 访问 1MB 内 存 。 其 中 ， 
0x00000 一 9FFFF 属于 常规 内 存 ， 由 内 存 条 提供 ; 0xF0000 一 0xFFFFF 
由 主板 上 的 一 个 心 片 提供 ， 即 ROM-BIOS。、 


内 存 


ROM-BIOS 
64KB 














640KB 


00000 


图 5-3 ”文本 模式 下 显存 到 内 存 的 映 风 


这 样 一 来 ， 中 间 还 有 一 个 320KB 的 空洞 ， 即 0xA0000 一 0xEFFFF 。 
传统 上 ， 这 上 段 地 址 空间 由 特定 的 外 围 设备 来 提供 ， 其 中 就 包括 显卡 。 
为 显示 功能 对 于 现代 计算 机 来 说 实在 是 太 重 要 了 了 。 

由 于 历史 的 原因 ， 所 有 在 个 人 计算 机 上 使 用 的 显卡 ， 在 加 电 目 检 之 
后 都 会 把 目 己 初始 化 到 80x 25 的 文本 模式 。 在 这 种 模式 下 ， 屏 幕 上 可 以 
显示 25 行 ， 每 行 80 个 字符 ， 每 屏 总 共 2000 个 字符 。 

所 以 ， 如 图 5-3 所 示 ， 一 直 以 来 ，0xB8000 一 0xBFFFF 这 段 物理 地 
址 空间 ， 是 留 给 显卡 的 ， 由 显卡 来 提供 ， 用 来 显示 文本 。 除 非 显 卡 出 了 


毛病 ， 侣 则 这 上段 空间 总 是 可 以 访问 的 。 如 有 条 显卡 出 了 毛病 怎么 办 呢 ? 很 
简单 ， 计 算 机 一 定 不 会 通过 加 电 目 检 过 程 ， 这 束 是 传说 中 的 严重 错误 ， 
计算 机 是 无 法 局 动 鸭 ， 更 不 要 说 加 载 并 执行 主 引 寻 忆 区 的 内 容 了 。 


5.4.2 ”初始 化 段 寄 存 占 


和 访问 主 内 存 一 样 ， 为 了 访问 显存 ， 也 需要 使 用 逻辑 地 址 ， 也 就 是 
采用 " 段 地 址 : 偏 移 地 址 ”的 形式 ， 这 是 处 理 器 的 要 求 。 考 虑 到 文本 模式 下 
显存 的 起 始 物 理 地 址 是 0xB8000， 这 块 内 存 可 以 看 成 是 段 地 址 为 
0xB800， 偏 移 地 址 从 0x0000 延伸 到 0xFFFF 的 区 域 ， 因 此 我 们 可 以 把 段 
地 址 定 为 0xB800。 


访问 内 存 可 以 使 用 段 寄 存 器 DS， 但 这 不 是 强制 性 的 ， 也 可 以 使 用 
ES。 因 为 DS 还 有 别 的 用 处 ， 所 以 在 这 里 我 们 使 用 ES 来 指 问 显存 所 在 的 
段 。 

源 程 序 第 6、7 行 ， 首 先 把 立即 数 0xB800 传送 到 AX， 然 后 再 把 AX 
的 值 传 送 到 ES。 这 样 ， 附 加 段 寄 存 器 ES 就 指向 0xB800 段 〈 段 基地 址 为 
0xB800) 。 


你 可 能 会 想 ， 为 什么 不 下 接 这 样 写 : 
mov es,0O0xb800 


而 要 用 寄存 器 AX 来 中 转 呢 ? 


原因 十 不 存在 这 样 的 指令 ，lIntel 的 处 理 硕 不 允许 将 一 个 立即 数 传 运 
到 段 寄 存 融 ， 它 只 允许 这 样 的 指令 : 


mov 段 寄 存 器 ， 通 用 寄存 器 
mov 段 寄 存 器 ， 内 存单 元 


没有 人 能 够 说 清楚 这 里 面 的 原因 ，Intel 公司 似乎 也 从 没有 提 到 过 这 
件 事 ， 尺 官 从 理论 上 ， 这 十 可 行 的 。 我 们 只 能 想 ， 也 许 Intel 是 出 于 好 
心 ， 避 免 我 们 无 意 中 犯 错 ， 毕 葛 ， 段 地 址 一 旦 改变 ， 后 面 对 内 存 的 访问 
祁 会 受到 影响 。 理 论 上 ， 麻 舌 一 点 的 方法 ， 可 以 保证 你 确实 知道 目 己 在 
做 什么 。 


5.4.3 ”显存 的 访问 和 ASCI 代码 


一 旦 将 显存 映射 到 处 理 器 的 地 址 空间 ， 那 么 ， 我 们 就 可 以 使 用 普通 
的 传送 指令 (mov) 来 读 写 它 ， 这 无 疑 是 非 沿 方便 的 ， 但 需要 首先 将 它 
作为 一 个 段 来 看 符 ， 并 将 它 的 基地 址 传送 到 段 寄 存 器 

为 此 ， 源 程序 的 第 10、11 行 ， 我 们 把 0xB800 作为 段 地 址 传送 到 附 
加 段 寄 存 器 ES， 以 后 就 用 ES 来 读 写 显存 。 这 样 ， 段 内 偏 移 为 0 的 位 置 就 
对 应 着 屏幕 左上 角 的 字符 。 

在 计算 机 中 ， 每 个 用 来 显示 在 屏幕 上 的 字符 ， 都 有 一 个 二 进 制 代 
他。 这 些 代 码 和 普通 的 二 进 制 数字 没有 什么 不 同 ， 唯 一 的 区 别 在 于 ， 发 
送 这 些 数 字 的 人 硬件 和 接收 这 些 数字 的 人 硬件 把 它们 解释 为 字符 ， 而 不 是 指 
令 或 者 用 于 计算 的 数字 。 

这 了 驶 是 说 ， 在 计算 机 中 ， 上 所 有 的 东西 都 是 无 差别 的 数字 ， 它 们 的 意 

义 ， 只 取决 于 生成 者 和 使 用 者 之 间 的 约定 。 为 了 在 终端 和 大 型 主机 ， 以 
及 主机 和 打印 机 、 显 示 器 之 间 交 换 信 息 ，1967 年 ， 美 国 国 家 标准 学 会 制 
定 了 美国 信息 交换 标准 代码 (American Standard Code for Information 
Interchange，ASCII) ， 如 表 5-1 所 示 。 


表 5-1 ASCII 表 
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在 不 同 设备 之 间 ， 或 者 在 同一 设备 的 人 不同 模块 之 间 有 一 个 信息 传递 
标准 是 非常 必要 的 。 想 想 看 ， 当 你 用 手机 癌 朋 友 友 大 短 消 息 时 ， 这 些 文 
字 当 然 被 编码 成 二 进 制 数字 。 如 果 对 方 的 手机 使 用 了 不 同 的 编码 ， 那 么 
他 将 无 法 正确 还 原 这 些 消 晨 ， 而 很 可 能 显示 为 乱 公 。 


值得 注意 的 是 ，ASCII 是 7 位 代码 ， 只 用 了 一 个 字 节 中 的 低 7 比特 ， 
最 高 位 通常 置 0。 这 意味 着 ，ASCII 只 包含 128 个 字符 的 编码 。 所 以 ， 在 
表 中 ， 水 平方 向 给 出 了 代码 的 高 3 比特 ， 而 垂直 方向 给 出 了 代码 的 低 4 比 
特 。 比 如 字符 天 ， 它 的 代码 是 二 进 制 数 的 010 1010， 即 0x2A。 


ASCIl 表 中 有 相当 一 部 分 代码 是 不 可 打印 和 显示 的 ， 它 们 用 于 控制 
通信 过 程 。 比 如 ，LF 是 换行 ，CR 是 回 车 ; DEL 和 BS 分 别 是 删除 和 氨 
格 ， 在 我 们 平时 用 的 键盘 上 也 是 有 的 ; BEL 是 振 铃 (使 远方 的 终端 啊 
令 ， 以 引起 注意 ) ; SOH 是 文 头 ; EOT 是 文 尾 ; ACK 是 确认 ， 等 等 。 


注意 ， 一 定 要 遵从 约定 。 比 如 ， 你 在 处 理 器 上 编写 程序 算 了 一 道 数 
学 题 2+3， 你 也 和 希望 把 结果 5 显示 在 屏幕 上 。 这 个 时 候 ， 算 出 的 结果 是 
0000 0101， 即 0x05。 但 是 ， 数 字 5 和 字符 5 是 不 同 的 ， 显 卡 在 任何 时 候 
者 认为 你 发 送 的 是 ASCI 人 码 。 所 以 ， 你 不 应 访 发 送 0x05， 而 应 访 有 发 送 
UX35 。 


屏幕 上 的 每 个 字符 对 应 着 显存 中 的 两 个 连续 字 闻 ， 前 一 个 是 字符 的 
ASCII 代码 ， 后 面 是 字符 的 显示 属性 ， 包 括 字 人 符 闫 色 〈 前 景色 ) 和 的 色 
(背景 色 ) 。 如 图 5-4 所 示 ， 字 符 “H” 的 ASCII 代码 是 0x48， 其 显示 属性 
是 0x07; 字符 "e" 的 ASCI 代码 是 0x65， 其 显示 属性 是 0x07。 


如 图 5-4 所 示 ， 字 符 的 显示 属性 (1 字 节 ) 分 为 两 部 分 ， 低 4 位 定义 
的 是 前 景色 ， 高 4 位 定义 的 是 背景 色 。 色 彩 主要 由 R、G、B 这 3 位 决 
定 ， 上 毕竟 我 们 知道 ， 可 以 由 红 CR) 、 绿 (G) 、 蓝 (B) 三 原色 来 配 出 
其 他 所 有 颜色 。K 是 闪烁 位 ， 为 0 时 不 闪烁 ， 为 1 时 闪烁 ; | 是 亮度 位 ， 
为 0 时 正常 亮度 ， 为 1 时 呈 高 亮 。 表 5-2 给 出 了 背景 色 和 前 景色 的 所 有 可 
能 值 。 


| | 背景 色 前 景色 


Soe 
B800:0005 
B800:0004 
B800:0003 
B800:0002 显示 融 
B800:0001 


B800:0000 





图 5-4 字符 代码 及 字符 属性 示意 图 
表 5-2 80x25 文本 模式 下 的 闫 色 表 
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从 表 5-2 来 看 ， 图 5-4 中 的 字符 属性 0x07 可 以 解释 为 黑 抵 日 子 ， 无 
闪烁 ， 无 加 亮 。 

你 可 能 党 得 奇怪 ， 当 屏幕 上 一 片 漆黑 ， 什 么 内 容 都 没有 的 时 候 ， 
存 里 会 是 什么 内 容 呢 ? 

实际 上 ， 这 个 时 候 ， 屏 幕 上 旺 示 的 全 是 黑 撒 白字 的 空白 字符 ， 也 叫 
空格 字符 〈Space) ，ASCII 代 码 是 0x20， 当 你 用 大 拇指 按 动 键盘 上 最 长 
的 那个 键 时 ， 束 产生 这 个 字符 。 因 为 它 是 空 日 ， 目 然 束 无 法 在 黑 奔 上 看 
到 任何 痕迹 了 。 


5.4.4 ”显示 字符 


从 源 程 序 的 第 10 行 开始 ， 到 第 35 行 ， 目 的 是 显示 一 串 字 符 “Label 
offset:"。 为 此 ， 需 要 把 它们 每 一 个 的 ASCIIl 人 码 顺序 写 到 显存 中 。 


为 了 方便 ， 多数 汇编 语言 编 详 旧 允许 在 指令 中 生 接 使 用 字符 的 字面 
值 来 代替 数值 形式 的 ASCI 码 ， 比 如 源 程序 第 10 行 : 


mov byte' [es:0x00]y 五 


这 等 效 于 


区 


mov byte [es:0x00],0x4c 


尽管 通过 查 表 可 以 知道 字符 “L”" 的 ASCIl 代码 是 0x4C， 但 毕竟 费事 。 
不 过 ， 要 在 指令 中 使 用 字符 的 字面 值 ， 这 个 字符 必须 用 引号 围 起 来 ， 瑟 
像 上 面 一 样 。 在 源 程序 的 编译 阶段 ， 汇 编 语言 编译 器 会 将 它 转换 成 ASCII 
人 码 的 形式 。 

当前 的 mov 指令 是 将 立即 数 传送 到 内 存单 元 ， 目 的 操作 数 是 内 存单 
元 ， 源 操作 数 是 立即 数 CASCI 代码 ) 。 为 了 访问 内 存单 元 ， 需 要 给 出 
段 地 址 和 偏 移 地 址 。 在 这 条 指令 中 ， 仿 移 地 址 0x00， 上 段 地 址 在 哪里 呢 ? 
一 般 情 况 下 ， 如 条 没有 附加 任何 指示 ， 段 地 址 默认 在 段 寄 存 器 DS 中 。 比 
如 : 


mov byvte [OxO0). "EE!’ 


当 执 行 这 条 指令 后 ， 处 理 占 把 段 寄存 此 DS 的 内 容 左 移 4 位 (相当 于 
乘 以 十 进 制 数 16 或 者 十 六 进 制 数 0x10) ， 加 上 这 里 的 偏 移 地 址 0x00， 就 
得 到 了 物理 地 址 。 


但 是 实际 上 ， 在 我 们 的 程序 中 ， 显 存 的 段 地 址 位 于 段 寄 存 器 ES 中 ， 
我 们 希望 使 用 ES 来 访问 内 存 。 因 此 ， 这 里 使 用 了 段 超越 前 绥 “es:”。 这 就 
是 说 ， 我 们 明确 要 求 处 理 器 在 生成 物理 地 址 时 ， 使 用 段 寄存 器 ES， 而 不 
是 默认 情况 下 的 DS。 

因为 指令 中 给 出 的 偏 移 地 址 是 0x00， 且 ES 的 值 已 经 在 前 面 被 设 为 
0xB800 ， 故 它 指 问 ES 段 中 ， 俩 移 地 址 为 0 的 内 存单 元 ， 即 
0xB800:0x0000， 也 就 是 物理 地 址 0xB8000， 这 个 内 存单 元 对 应 着 屏幕 
左上 角 第 一 个 字符 的 位 置 。 


还 圾 要 注意 的 是 ， 因 为 目的 操作 数 给 出 的 古 一 个 内 存 地 址 ， 我 们 要 
用 源 操作 数 来 修改 这 个 地 址 里 的 内 容 ， 所 以 ， 目 的 操作 数 必须 用 方 括 号 
围 起 来 ， 以 表明 它 是 一 个 地 址 ， 处 理 器 应 该 用 这 个 地 址 再 次 访问 内 存 ， 
将 源 操作 数 写 进 这 个 单元 。 实 际 上 ， 这 类 似 于 电 级 语言 里 的 指针 。 

最 后 ， 关 键 字 “byte” 用 来 修饰 目的 操作 数 ， 指 出 本 次 传送 是 以 季节 的 
方式 进行 的 。 在 16 位 的 处 理 夫 上 ， 单 次 操作 的 数据 视 度 可 以 是 8 位 ， 也 
可 以 是 16 位 。 到 的 是 8 位 ， 还 是 16 位 ， 可 以 根据 目的 操作 数 或 者 源 操 作 
数 来 判断 。 吐 憾 的 是 ， 在 这 里 ， 目 的 操作 数 是 仿 移 地 址 90x00， 它 可 以 走 
字 市 单元 ， 也 可 以 是 字 蛙 元 ， 到 捕 是 哪 一 种 ， 无 法 判断 ;， 而 源 操作 数 
呢 ， 是 立即 数 0xX4C， 它 既 可 以 解释 为 8 位 的 0xX4C， 也 可 以 解释 为 16 位 
的 0x004C。 在 这 种 情况 下 ， 编 详 帮 将 无 法 搞 异 你 的 真实 意图 ， 只 能 报告 
错误 ， 所 以 必须 用 "byte" 或 者 "word "进行 修 饥 《明确 指示 ) 。 于 是 ， 一 旦 
日 的 操作 数 被 指明 是 “byte” 的 ， 那 么 ， 源 操作 数 的 冤 度 也 束 明 确 了 。 相 反 
地 ， 下 面 的 指令 区 不 怖 要 任何 修饰 : 


mov [0x00] ,al ; 按 字 节操 作 
mov al 19xU 过 | ; 按 字 探 


因为 屏幕 上 的 一 个 字符 对 应 看 内 存 中 的 两 个 字 节 : ASCI 代码 和 属 
性 ， 所 以 ， 源 程序 第 11 行 的 功能 是 将 属性 值 0Xx07 传送 到 下 一 个 内 存单 
元 ， 即 偏 移 地 址 0x01 处 。 这 个 属性 可 以 解释 为 黑帮 和 白字， 无 闪烁 ， 也 无 
加 亮 ， 请 参阅 表 5-2。 


后 面 ， 从 第 12 行 开始 ， 到 第 35 行 ， 用 于 癌 喧 示 绥 冲 区 址 元 剩余 部 分 
的 衬 符 。 注 总， 在 这 个 过 程 中 ， 偶 移 地 址 一 二 是 递增 的 。 


5.4.5 MOV 指令 的 格式 


到 目前 为 止 ， 我 们 已 经 多 次 接触 了 mov 指令 。 在 处 理 套 的 整个 指令 
集中 ，mov 指令 是 用 得 最 多 的 一 条 。 

mov 指令 用 于 数据 传 运 。 既 然 古 数据 传 迹 ， 那 么 ， 目 的 操作 数 的 作 
用 应 该 相当 于 一 个 “ 容 占 "， 故 必须 是 通用 寄存 右 或 者 内 存 蛙 元 ;， 源 操作 数 
昵 ， 也 可 以 是 和 目的 操作 数 具 有 相同 数据 宽度 的 通用 寄存 磺 和 内 人 存单 
元 ， 偿 可 以 是 立即 数 。 传 送 指令 只 影 啊 目的 操作 数 的 内 容 ， 丰 改变 源 操 
作 数 的 内 容 。 比 如 : 


mov ah,bh 


moVv ax,dx 


以 上 ， 第 一 条 指令 的 目的 操作 数 和 源 操作 数 都 是 8 位 寄存 器 ， 指 令 执 
行 后 ， 寄 存 硕 AH 的 内 容 和 BH 相同 ; 第 二 条 指令 的 目的 操作 数 和 源 操 作 
数 者 是 16 位 寄存 上 融 ， 指 令 执 行 后 ， 寄 和 存 名 AX 的 内 容 和 DX 相同 。 但 是 ， 
由 于 数据 宽度 不 同 ， 下 面 这 条 指令 融 是 错误 的 : 


moOv ax bl 
再 来 看 下 面 两 条 指令 : 


mo LOUx] pn 


mov ax, [OX06| 


以 上 ， 第 一 条 指令 是 把 寄存 器 BL 中 的 内 容 传 送 到 偏 移 地 址 为 0x02 
的 8 位 内 存单 元 ; 第 二 条 指令 是 把 偏 移 地 址 为 0x06 的 16 位 内 存单 元 里 的 
内 容 传 送 到 寄存 器 AX 中 。 由 于 这 两 条 指令 中 都 有 寄存 堪 操 作 数 ， 故 不 需 
要 用 “byte” 或 者 ”Word” 来 修饰 。 


传送 指令 的 源 操 作 数 也 可 以 是 立即 数 。 比 如 : 


mov ay 0x05 


mow Word |0xitl. 0xt000 


以 上 ， 第 一 条 指令 是 把 立即 数 0x05 传送 到 寄存 器 AH 中 ， 指 令 执行 
后 ，AH 中 的 内 容 为 0x05; 第 二 条 指令 是 把 立即 数 0xf000 传送 到 仿 移 地 
址 为 0x1c 的 16 位 内 存单 元 中 。 因 为 上 一 和 所 说 的 原因 ， 这 里 要 用 word 
来 修饰。 


mov 指令 的 目的 操作 数 不 允许 为 立即 数 ， 而 且 ， 目 的 操作 数 和 源 操 
作 数 不 允许 同时 为 内 存单 元 。 因 此 ， 下 面 两 条 指令 都 是 不 正确 的 : 


In OX1C al 


mow 【昌文 9 LOxOZ| 
以 上 ， 说 第 一 条 指令 是 错误 的 ， 这 很 好 理解 。 想 想 看 ， 你 把 寄存 套 


AL 中 的 内 容 传送 给 一 个 立即 数 ， 这 是 什么 意思 了 呢 ? 于 理 不 通 。 至 于 第 二 
条 指令 为 什么 不 正确 ， 那 是 因为 处 理 器 不 允许 在 两 个 内 存单 元 之 间 直 接 


进行 传送 操作 。 事 实 上 ， 这 条 指令 的 功能 可 以 用 两 条 指令 实现 《假设 传 
送 的 是 一 个 字 ) : 


mv a [O02 | 


mov OOXX 


就 算 处 理 器 支持 在 两 个 内 存单 元 之 间 直 接 传送 数据 ， 那 么 ， 它 依然 
是 在 内 部 按 上 面 的 两 个 步骤 进行 操作 的 。 而 且 ， 文 持 这 种 直接 传送 操作 
还 需要 增加 额外 的 电路 。 

不 单单 是 mov 指令 ， 其 他 指令 都 不 文 持 在 两 个 内 存单 元 之 间 直 接 进 
行 操 作 ， 包 括 加 、 减 、 乘 、 除 和 逻辑 运算 等 指令 。 事 情 是 明摆着 的 ， 降 
然 增 加 了 人 处理 右 的 复杂 性 之 后 和 用 两 条 指令 没什么 区 别 ， 干 脆 就 用 两 条 
指令 好 了 。 

检测 点 5.1 


1. 在 我 们 日 党 使 用 的 个 人 计算 机 上 ， 文 本 模式 下 的 民 示 绥 冲 区 被 映 
慰 到 物理 内 存 地 址 空间 ， 起 始 地 址 为 ( ) ， 它 对 应 的 段 地 址 为 ( ) 。 在 
标准 的 80x25 文本 模式 下 ， 要 想 在 屏幕 右 下 角 显 示 一 个 绿 撒 白字 的 字符 
“H”， 那 么 ， 应 当 在 该 段 内 偏 移 量 为 ( ) 的 地 方 开始 ， 连 续 写 入 两 个 字 市 
() 和 ()。 


2. 以 下 指令 中 ， 哪 些 是 正确 的 ， 不 正确 的 原因 是 什么 ? 


A.mov al,Ux55aa B.mov ds,0x6000 C.mov 
ds ,al 

D.mov [0x06],0x55aa E.mov ds,bx F.mov 
ax,0x02 

G.mov word [0x0al,ax H.mov es,CX |.mov 
ax,Db| 

J.mov byte [0x00],c K.mov [0x02],[0xf000] L.mov 


ds,[0x03] 


5.5 ”显示 标号 的 汇编 地 址 


5.5.1 标号 


处 理 器 访问 内 存 时 ， 采 用 的 是 “ 段 地 址 : 偏 移 地 址 ”的 模式 。 对 于 任何 
一 个 内 存 段 来 说 ， 段 地 址 可 以 开始 于 任何 16 字 太 对齐 的 地 方 ， 偏 移 地 址 
则 总 是 从 0x0000 开始 递增 。 

为 了 支持 这 种 内 存 访 问 模 式 ， 在 源 程 序 的 编译 阶段 ， 编 译 器 会 把 源 
程序 5-1 整体 上 作为 一 个 独立 的 段 来 处 理 ， 并 从 0 开始 计算 和 跟踪 每 一 条 
指令 的 地 址 。 因 为 该 地 址 是 在 编译 期 间 计 算 的 ， 故 称 为 汇编 地 址 。 汇 编 
地 址 是 在 源 程序 编译 期 间 ， 编 译 絮 为 每 条 指令 确定 的 汇编 位 置 

(Assembly Position ) ， 指 示 该 指令 相对 于 程序 或 者 段 起 始 处 的 距离 ， 
以 字 节 计 。 当 编译 后 的 程序 装 入 物理 内 存 后 ， 它 又 是 该 指令 在 内 存 段 内 
的 偏 移 地 址 。 


如 表 5-3 所 示 ， 在 用 我 们 的 配 书 工具 Nasmide 书写 并 编译 代码 清单 5- 
1 后 ， 除 了 生成 一 个 以 “bin" 为 扩展 名 的 二 进 制 文件 ， 还 会 生成 一 个 以 
“st 为 扩展 名 的 列表 文件 。 这 张 表 列 出 的 ， 就 是 本 章 代 码 清单 5-1 编译 后 
生成 的 列表 文件 内 容 。 

表 5-3 共 分 五 栏 ， 从 左 到 右 依 次 是 行 号 、 指 令 的 汇编 地 址 、 指 令 编 译 
后 的 机 器 代码 、 源 程序 代码 和 注释 。 可 以 看 出 ， 第 一 条 指令 mov 
ax,0xb800 的 汇编 地 址 是 0x00000000, 对 应 的 机 器 代码 为 B8 00 B8; 第 二 
条 指令 mov es,ax 的 汇编 地 址 是 0x00000003， 机 器 代码 为 8E C0。 


表 5-3 ”代码 清单 5-1 编译 后 的 列表 文件 内 容 


00000000 
00000003 


00000005 
0000000B 
00000011 
00000017 
0000001D 
00000023 
00000029 
0000002F 
00000035 
0000003B 
00000041 
00000047 


B800B8 
8EC0 


26C60600004C 
26C606010007 
26C606020061 
26C606030007 
26C606040062 
26C606050007 
26C606060065 
26C606070007 
26C60608006C 
26C606090007 
26C6060A0020 
26C6060B0007 


:代码 清单 5-1 

;文件 名 : c05 mbr.asm 
;文件 说 明 : 硬盘 主 引 导读 区 代码 
:创建 日 期 : 2011-3-31 21:15 
mov ax,0xb800 :; 指 同文 本 模式 的 显示 绥 冲 区 


INOV ©S,aX 


:以 下 显示 字符 串 "Label offset:" 
mov byte [es:0x00],'L' 
mov byte [es:0x011],0x07 
mov byte [es:0x021],'a' 
mov byte [es:0x03],0x07 
mov byte [es:0x04],'b' 
mov byte [es:0x05],0x07 
mov byte [es:0x06],'e' 
mov byte [es:0x07],0x07 
mov byte [es:0x08], 
mov byte [es:0x091],0x07 
mov byte [es:0x0al]," ' 


mov byte [es:0x0b],0x07 





0000004D 
00000053 
00000059 
0000005F 
00000065 
0000006B 
00000071 
00000077 
0000007D 
00000083 
00000089 
0000008F 
00000095 
0000009B 


000000Al 
000000A4 


000000A7 
000000A9 


000000AB 
000000AE 
000000B0 


000000B4 
000000B6 
000000B8 


000000BC 
000000BE 
000000C0 


000000C4 
000000C6 
000000C8 


26C6060CO06F 
26C6060D0007 
26C6060E0066 
26C6060F0007 
26C606100066 
26C606110007 
26C606120073 
26C606130007 
26C606140065 
26C606150007 
26C606160074 
26C606170007 
26C60618003A 
26C606190007 


B8[2E01] 
BB0OA00 


8CC9 
8ED9 


BA0000 
F7F3 
8816[2E7D] 


31D2 
F7F3 
8816[2F7D] 


31D2 
F7F3 
8816[307D] 


31D2 
F7F3 
8816[317D] 


mov byte [es:0x0c],"o" 
mov byte [es:0x0d],0x07 
mov byte [es:0x0el],'f 
mov byte [es:0xOf],0x07 
mov byte [es:0x10],'f 
mov byte [es:0x11],0x07 
mov byte [es:0x12],'s' 
mov byte [es:0x13],0x07 
mov byte [es:0x14],'e' 
mov byte [es:0x15],0x07 
mov byte [es:0x16],'t 
mov byte [es:0x17],0x07 
mov byte [es:Ox18].2 
mov byte [es:0x19],0x07 


mov ax.number 


mov bx.10 


;设置 数据 段 的 基地 址 
ImOV cX.cS 


mov ds.cx 


; 求 个 位 上 的 数字 

mov dx,0 

div bx 

mov [0x7c00+number+0Ox00],dl 


: 求 十 位 上 的 数字 
xor dx,dx 
div bx 


mov [Ox7c00+number+0x01],dl 


; 求 百 位 上 的 数字 
XOT dx.dx 
div bx 


mov [0x7c00+number+0x02],dl 


; 求 千 位 上 的 数字 

XOr dx,dx 

div bx 

mov [Ox7c00+number+0Ox03],dl 


: 求 万 位 上 的 数字 


:取得 标号 number 的 偏 移 地 址 


;保存 个 位 上 的 数学 


;保存 十 位 上 的 数字 


;保存 百 位 上 的 数字 


;保存 和 干 位 上 的 数字 


100 
101 
102 
103 


从 表 5-3 中 可 以 看 出 ， 在 编 详 阶段 ， 


汇编 地 址 ， 束 像 它 们 已 经 被 加 载 到 内 存 中 的 东 个 段 里 一 样 。 实 际 上 ， 如 


000000CC 
000000CE 
000000D0 


000000D4 
000000D7 
000000D9 
000000DD 


000000E3 
000000E6 
000000E8 
000000EC 


000000F2 
000000F5 
000000F7 
000000FB 


00000101 
00000104 
00000106 
0000010A 


00000110 


00000113 


00000115 


00000119 


0000011F 
00000125 


0000012B 


0000012E 


00000133 
000001FE 


31D2 
F7F3 
8816[327D] 


A0[327D] 
0430 
26A21A00 
26C6061B0004 


A0[317D] 

0430 
26A21C00 
26C6061D0004 


A0[307D] 
0430 
26A21E00 
26C6061F0004 


AO[2F7D] 
0430 
26A22000 
26C606210004 


AO0[2E7D] 
0430 
20A22200 


26C606230004 


26C606240044 
26C606250007 


E9FDFF 


0000000000 


00<rept> 
55AA 


xor dx,dx 

div bx 

mov [0x7c00+number+0x04],dl ;保存 万 位 上 的 数字 
;以 下 用 十 进 制 显示 标号 的 偏 移 地 址 

mov al,[0x7c00-number+0Ox04] 

add al,0x30 

mov [es:0xl1al,al 


mov byte [es:0x1b],0x04 


mov al,[|0x7c00+number+Ox03] 
add al,Ox30 
mov [es:0xlc],al 


mov byte [es:0x1d],0x04 


mov al,[0Qx7c00+number+0x02] 
add al,Ox30 
mov [es:0xlel,al 


mov byte [es:0x1f|,0x04 


mov al.[0x7c00+number+0x01] 
add al,0x30 
mov [es:0x201,al 


mov byte [es:0x21],0x04 


mov al,[0x7c00number+0x00] 
add al,0x30 
mov [es:0x221],al 


mov byte [es:0x231,0x04 


mov byte [es:0x24],'D' 
mov byte [es:0x25],0x07 


infi: jmp near infi ;无 限 循环 


number db 0.0.0.0.0 


times 203 db 0 
db Ox55,.0xaa 


每 条 指令 都 被 计算 并 赋予 了 一 个 


图 5-5 所 示 ， 当 编 详 好 的 程序 加 载 到 物理 内 存 后 ， 它 在 段 内 的 偶 移 地 址 和 
它 在 编 详 阶 段 的 汇编 地 址 是 相同 的 。 


6000: FFEFF 


0000: 0003 


00000000 B800B8 mov ax ，0xb800 
00000003 8EC0 moves, ax 


6000: 0000 





图 5-5 ”汇编 地 址 和 偏 移 地 址 的 关系 


正如 图 5-5 所 示 ， 编 译 后 的 程序 是 整体 加 载 到 内 存 中 某 个 段 的 ， 交 又 
箭头 用 于 指示 它们 之 间 的 映射 关系 。 之 所 以 箭头 是 交叉 的 ， 是 因为 源 程 
序 的 编译 是 从 上 往 下 的 ， 而 内 存 地 址 的 增长 是 从 下 往 上 的 (从 低地 址 往 
高 地 址 方 同 增长 〉。 

图 5-5 中 假定 程序 是 从 内 存 物 理 地 址 0x60000 开始 加 载 的 。 因 为 该 物 
理 地 址 也 对 应 着 逻辑 地 址 0x6000:0x0000， 因 此 我 们 可 以 说 ， 该 程序 位 于 
段 0x6000 内 。 

在 编译 阶段 ， 源 程序 的 第 一 条 指令 mov ax,0xb800 的 汇编 地 址 是 
0x00000000， 而 它 在 整个 程序 装 入 内 存 后 ， 在 段 内 的 偏 移 地 址 是 
0x0000， 即 逻辑 地 址 0x6000:0000， 两 者 的 偏 移 地 址 是 一 致 的 。 

再 看 源 程 序 的 第 二 条 指令 ， 是 mov es ,ax， 它 在 编译 阶段 的 汇编 地 址 
是 0x00000003 。 在 整个 程序 闭 入 内 存 后 ， 它 在 段 内 的 偏 移 地 址 是 
0x0003， 也 没有 变化 。 

这 就 很 好 地 说 明了 汇编 地 址 和 偏 移 地 址 之 间 的 对 应 关系 。 理 解 这 一 
点 ， 对 后 面 的 编程 很 重要 。 


在 NASM 汇编 语言 里 ， 每 条 指令 的 前 面 都 可 以 拥有 一 个 标号 ， 以 代 
表 和 指示 该 指令 的 汇编 地 址 。 毕 竟 ， 由 我 们 自己 来 计算 和 跟踪 每 条 指令 
所 在 的 汇编 地 址 是 极其 困难 的 。 这 里 有 一 个 很 好 的 例子 ， 比 如 源 程 序 第 
98 行 ; 


inf1 mp near nf 


在 这 里 ， 行 首 带 冒号 的 是 标号 是 “infr*”。 请 看 表 5-3， 这 条 指令 的 汇编 
地 址 是 0x0000012B ， 故 infi 惑 代 表 数 值 0x0000012B ， 或 者 说 是 
0x0000012B 的 符号 化 表示 。 


标 写 之 后 的 冒号 是 可 选 的 。 所 以 下 面 的 写法 也 是 正确 的 : 
nu Tenea hE 


标号 并 不 是 必需 的 ， 只 有 在 我 们 需要 引用 茶 条 指令 的 汇编 地 址 时 ， 
才 使 用 标 握 。 正 古 因为 这 样 ， 本 草 源 程序 中 的 绝 大 多 数 指令 部 没有 标 


号 
标号 可 以 单独 占用 一 行 的 位 置 ， 像 这 样 : 


To 


]mp near infi 


这 种 写法 和 第 98 行 相 比 ， 效 果 并 没有 什么 不 同 ， 因 为 infi 所 在 的 那 
一 行 没有 指令 ， 它 的 地 址 就 是 下 一 行 的 地 址 ， 换 名 话说 ， 和 下 一 行 的 地 
址 是 相同 的 。 

标号 可 以 由 字母 、 数 字 、“"、“$、' 坟 、“@”"、“~"、“"、“? "组 成 


但 必须 以 字母 、“”、““ 和 “? ”中 的 任意 一 个 打头 。 
5.5.2 ”如 何 显示 十 进 制 数 字 

我 们 已 经 知道 ， 标 号 代表 并 指示 它 所 在 位 置 处 的 汇编 地 址 。 现 在 ， 
我 们 要 编写 指令 ， 在 屏幕 上 把 这 个 地 址 的 数值 显示 出 来 。 为 此 ， 源 程序 
的 第 37 行 用 于 获取 标号 所 代表 的 汇编 地 址 : 


mov ax,number 


标号 “number 位 于 源 程序 的 第 100 行 ， 只 不 过 后 面 没 有 跟着 冒号 
“”。 你 当然 可 以 加 上 冒号 ,但 这 无 天 案 要 。 注 意 ， 传 过 到 寄存 费 AX 的 值 
是 在 源 程 序 编 诺 时 确定 的 ， 在 编 详 阶段 ， 编 详 堪 会 将 标号 number 转换 成 
立即 数 。 如 表 5-3 所 示 ， 标 号 number 处 的 汇编 地 址 是 0x012E， 因 此 ， 这 
条 语句 其 实 束 是 (等 效 于 ) 


moOV ax, Ox012E 


问题 在 于 ， 如 果 不 是 借助 于 别 的 工具 和 手段 ， 你 不 可 能 知道 此 处 的 
汇编 地 址 是 0x012E。 所 以 ， 在 汇编 语言 中 使 用 标 与 的 好 处 是 不 必 关 心 这 


些 。 

因此 ， 当 这 条 指令 编译 后 ， 得 到 的 机 器 指令 为 B8[2E01]， 或 者 B8 2E 
01。B8 是 操作 码 ， 后 面 是 字 操 作 数 0x012E， 只 不 过 采用 的 是 低 端 字 节 
序 。 

十 六 进 制 数 0x012E 等 于 十 进 制 数 302， 但 是 ， 通 过 前 面 对 字 符 显 示 
原理 的 介绍 ， 我 们 应 该 清楚 ， 直 接 把 寄存 器 AX 中 的 内 容 传送 到 显示 缓冲 
区 ， 是 不 可 能 在 屏幕 上 出 现 “302” 的 。 

解决 这 个 问题 的 办 法 是 将 它 的 每 个 数位 单独 拆 分 出 来 ， 这 需要 不 停 
地 除 以 10。 

考虑 到 寄存 器 AX 是 16 位 的 ， 可 以 表示 的 数 从 二 进 制 的 
0000000000000000 到 1111111111111111， 也 就 是 十 进 制 的 0 一 65535， 
故 它 可 以 容纳 最 大 5 个 数位 的 十 进 制 数 ， 从 个 位 到 万 位 ， 比 如 61238。 那 
么 ， 假 如 你 并 不 知道 它 是 多 少 ， 只 知道 它 是 一 个 5 位 数 ， 那 么 ， 如 何 通过 
分 解 得 到 它 的 每 个 数位 呢 ? 

首先 ， 用 61238 除 以 10， 商 为 6123， 余 8， 本 次 相 除 的 余数 8 就 是 个 
位 数字 ; 

然后 ， 把 上 一 次 的 丙 数 6123 作为 被 除数 ， 再 次 除 以 10， 丙 为 612， 
余 3， 余 数 3 就 是 十 位 上 的 数字 ; 

接着 ， 再 用 上 一 次 的 商 数 612 除 以 10， 商 为 61， 余 2， 余 数 2 就 是 百 
位 上 的 数字 ; 

间 上 ， 再 用 61 除 以 10， 商 为 6， 余 1， 人 余数 1 就 是 千 位 上 的 数字 :; 

最 后 ， 用 6 除 以 10， 商 为 0， 余 6， 人 余数 6 就 是 万 位 上 的 数字 。 





| 


很 显然 ， 只 要 把 AX 的 内 容 不 停 地 除 以 10， 只 需要 5 次 ， 把 每 次 的 余 
数 反 问 组 合 到 一 起 ， 束 是 原来 的 数字 。 同 样 ， 如 果 反 问 把 每 次 的 余数 显 
示 到 屏 敌 上， 应 该 束 能 看 见 这 个 十 进 制 数 是 多 少 了 ，。 

不 过 ， 即 使 是 得 到 了 单个 的 数位 ， 也 还 是 不 能 在 屏幕 上 显示 ， 因 为 
它们 是 数字 ， 而 非 ASCII 代 码 。 比 如， 数字 0x05 和 字符 “5" 是 不 同 的 ， 后 
者 实际 上 是 数字 0x35。 


观察 表 5-1， 你 会 发 现 ， 字 符 “0” 的 ASCIl 代码 是 0x30， 字 符 “1” 的 
ASCI 代码 是 0x31， 字 符 “9” 的 ASCI| 代码 是 0x39。 这 就 是 说 ， 把 每 次 相 
除 得 到 的 余数 加 上 0x30， 在 屏幕 上 显示 束 没 问题 了 。 


5.5.3 ”在 程序 中 声明 并 初始 化 数据 


可 以 用 处 理 右 提供 的 除法 指令 来 分 解 一 个 数 的 各 个 数位 ， 但 是 每 次 
除法 操作 后 得 到 的 数位 需要 临时 你 存 起 来 以 备 后 用 。 使 用 寄存 具 不 太 现 
实 ， 因 为 它 的 数量 很 少 ， 且 还 要 在 后 续 的 指令 中 使 用 。 因 此 ， 最 好 的 办 
法 是 在 内 存 中 专门 留 出 一 些 空间 来 保存 这 些 数位 。 

尽管 我 们 的 目的 仅仅 是 分 配 一 些 空间 ， 但 是 ， 要 达到 这 个 目的 必须 
倪 始 化 一 些 彻 始 数 据 来 “ 占 位 *。 这 束 好 比 是 排队 买 火车 时 ， 你 可 以 派 任何 
无 关 的 人 去 帮 你 占 个 位 置 ， 真 正 轮 到 你 买 的 时 候 ， 你 再 出 现 。 产 程序 的 
第 100 行 用 于 声明 并 初始 化 这 些 数据 ， 而 标志 number 则 代表 了 这 些 数据 
的 起 始 汇编 地 址 。 


要 放 在 程序 中 的 数据 是 用 DB 指令 来 声明 (Declare) 的 ，DB 的 意思 
是 声明 字 节 (Declare Byte) ， 所 以 ， 跟 在 它 后 面 的 操作 数 都 占 一 个 字 节 
的 长 度 〈 人 位置) 。 注 意 ， 如 果 要 声明 超过 一 个 以 上 的 数据 ， 各 个 操作 数 
之 间 必 须 以 逗号 隔 开 。 

除 此 之 外 ，DW (Declare Word) 用 于 声明 字数 据 ，DD (Declare 
Double Word ) 用 于 声明 双 字 【两 个 字 ) 数据 ，DQ (Declare Quad 
Word) 用 于 声明 四 字数 据 。DB、DW、DD 和 DQ 并 不 是 处 理 器 指令 ， 
它 只 是 编译 器 提供 的 汇编 指令 ， 上 所 以 称 做 仿 指 令 (pseudo 
Instruction ) 。 伪 指令 是 汇编 指令 的 一 种 ， 它 没有 对 应 的 机 器 指令 ， 所 以 
它 不 是 机 桥 指 令 有 的 助 记 从 ， 仪 仅 在 编译 阶段 由 编 详 旧 执 行 ， 编 译 成 功 
后 ， 伪 指令 就 消失 了 ， 所 以 在 程序 执行 时 ， 伪 指令 是 得 不 到 人 处理 絮 光 顾 
的 ， 实 际 上 ， 程 序 执行 时 ， 伪 指令 已 不 存在 。 


声明 的 数据 可 以 是 任何 值 ， 只 要 不 超过 伪 指 令 所 指示 的 大 小 。 比 
如 ， 用 DB 声明 的 数据 ， 不 能 超过 一 个 字 节 所 能 表示 的 数 的 大 小 ， 即 
0xFF。 我 们 在 此 声明 了 5 个 字 节 ， 并 将 它们 的 值 都 初始 化 为 0。 


和 指令 不 同 ， 对 于 在 程序 中 声明 的 数值 ， 在 编 详 阶 段 ， 编 详 带 会 在 
它们 被 声明 的 和 汇编 地 址 处 原样 保留 。 


按照 标准 的 做 法 ， 程 序 中 用 到 的 数据 应 当 声 明 在 一 个 独立 的 段 ， 即 
数据 段 中 。 但 是 在 这 里 ， 为 方便 起 见 ， 数 据 和 指令 代码 是 放 在 同一 个 段 
中 的 。 不 过 ， 方 便 是 方便 了 ， 但 也 带 来 了 一 个 隐患 ， 如 果 安 排 不 当 ， 处 
理 占 就 有 可 能 执行 到 那些 非 指 令 的 数据 上 上。 尽管 有 些 数 伴 巧 和 某 些 指令 
的 机 器 码 相 同 ， 也 可 以 顺利 执行 ， 但 毕竟 不 是 我 们 想 要 的 结果 ， 违 背 了 
我 们 的 初衷 。 

好 在 我 们 很 小 心 ， 在 本 程序 中 把 数据 声明 在 所 有 指令 之 后 ， 在 这 个 
地 方 ， 处 理 器 的 执行 流程 无 法 到 达 。 

检测 点 5.2 


找 出 下 面 代 码 片 断 中 的 错误 。 用 nasmide 程序 实际 编译 一 下 ， 看 看 
结果 如 何 。 


data1 db Ox55,0x{f000,0x0Of 
data2 dw 0x38,0x20,0x55aa 


5.5.4 分 解数 的 各 个 数位 


源 程序 第 41、42 行 ， 是 把 代码 段 寄存 器 CS 的 内 容 传送 到 通用 寄存 
器 CX， 然 后 再 从 CX 传送 到 数据 段 寄存 器 DS。 在 此 之 后 ， 数 据 段 和 代码 
段 都 指向 同一 个 段 。 之 所 以 这 么 做 ， 是 因为 我 们 刚才 声明 的 数据 是 和 指 
令 代 码 混在 一 起 的 ， 可 以 认为 是 位 于 代码 段 中 。 尽 管 在 指令 中 访问 这 些 
数据 可 以 使 用 段 超越 前 级 “CS:"， 但 习惯 上 ， 通 过 数据 段 来 访问 它们 更 自 
然 一 些 。 


前 面 已 经 说 过 ， 要 分 解 一 个 数 的 各 个 数位 ， 需 要 做 除法 。8086 处 理 
器 提供 了 除法 指令 div， 它 可 以 做 两 种 类 型 的 除法 。 

第 一 种 类 型 是 用 16 位 的 二 进 制 数 除 以 8 位 的 二 进 制 数 。 在 这 种 情况 
下 ， 被 除数 必须 在 寄存 器 AX 中 ， 必 须 事 先 传送 到 AX 寄存 器 里 。 除 数 可 


以 由 8 位 的 通用 寄存 右 或 者 内 存单 元 提供 。 指 令 执 行 后 ， 丙 在 寄存 占 AL 
中 ， 人 余数 在 寄存 苍 AH 中 。 比 如 : 


dav Cl 


div byte [OxX0023] 


前 一 条 指令 中 ， 寄 和 存 器 CL 用 来 提供 8 位 的 除数 。 假 如 AX 中 的 内 容 
是 0x0005，CL 中 的 内 容 是 0x02， 指 令 执 行 后 ，CL 中 的 内 容 不 变 ，AL 
中 的 商 是 0x02，AH 中 的 余数 是 0x01。 


后 一 条 指令 中 ， 除 数位 于 数据 段 内 仿 移 地 址 为 0x0023 的 内 存单 元 
里 。 这 条 指令 执行 时 ， 处 理 融 将 数据 段 寄 存 邢 DS 的 内 容 左 移 4 位 ， 加 上 
偏 移 地 址 0x0023 以 形成 物理 地 址 。 然 后 ， 处 理 奉 冉 次 访问 内 存 ， 从 那个 
物理 地 址 处 取得 一 个 字 节 ， 作 为 除数 同 寄存 右 AX 做 一 次 除法 。 


任何 时 候 ， 只 要 是 在 指令 中 涉及 内 存 地 址 的 ， 都 允许 使 用 段 超越 前 
级 。 比 如 : 


div Bvte [es:0x0023| 
div byte [es:0x0023] 


话 又 说 回来 了 了， 在 一 个 源 程 序 中 ， 通 彰 不 可 能 知道 汇编 地 址 的 具体 
数值 ， 只 能 使 用 标号 。 所 以 ， 指 令 中 的 地 址 部 分 更 稼 见 的 形式 是 使 用 标 
号 。 比 如 ; 


本 六 QQ dw 0X2410 
QISOFEOOE 作 过 有 下 


TID ax, Id1v1idndl 


div bvyte [divisor| 


上 和 面 的 程序 很 有 章 轧 ， 首 先 ， 声 明了 标号 dividnd 并 初始 化 了 一 个 字 
0x3f0 作为 们 除数， 然后， 又 声明 了 标号 divisor 并 初始 化 一 个 字 广 0x3f 
作为 除数 。 

在 后 面 的 mov 和 div 指令 中 ， 是 用 标号 dividnd 和 divisor 来 代 蔡 被 除 
数 和 除数 的 汇编 地 址 。 在 编译 阶段 ， 编 译 器 用 具体 的 数值 取代 括号 中 的 
标号 dividnd 和 divisor。 现 在 ， 假 设 dividnd 和 divisor 所 代表 的 汇编 地 址 


分 别 是 0xf000 和 0xf002， 那 么 ， 在 编译 阶段 ， 编 译 需 在 生成 这 两 条 指令 
的 机 器 码 之 前 ， 会 先 将 它们 转换 成 以 下 的 形式 : 


mow ax [0Xt000 
div byte [Oxf002] 


当 第 一 条 指令 执行 时 ， 人 处理 器 用 0xf000 作为 偏 移 地 址 ， 去 访问 数据 
段 〈( 段 地 址 在 段 寄 存 嚣 DS 中 ) ， 来 取得 内 存 中 的 一 个 字 0x3F0， 并 把 它 
传送 到 等 存 器 AX 中 。 


当 第 二 条 指令 执行 时 ， 处 理 器 采用 同样 的 方法 取得 内 存 中 的 一 个 字 
节 0x3F， 用 它 来 和 寄存 器 AX 中 的 内 容 做 除法 。 当 然 ， 除 法 指令 div 的 功 
能 你 是 知道 的 。 

说 了 这 么 多 ， 其 实 是 在 强调 标号 和 汇编 地 址 的 对 应 关系 ， 以 及 如 何 
在 指令 中 使 用 符号 化 的 偏 移 地 址 。 

第 二 种 类 型 是 用 32 位 的 三 进 制 数 除 以 16 位 的 三 进 制 数 。 在 这 种 情况 
下 ， 因 为 16 位 的 处 理 器 无 法 直接 提供 32 位 的 被 除数 ， 故 要 求 被 除数 的 
高 16 位 在 DX 中 ， 低 16 位 在 AX 中 。 


十 进 制 数 2218367590 等 于 以 下 一 进 制 数 这 里 有 一 个 例子 ， 如 图 5-6 所 
示 ， 假 如 航 除 数 和 是 十 进 制 数 

10000100001110011001101001100110 2218367590， 那么 ， 已 对 应 看 一 个 
寄存 器 DX 寄存 器 AX 32 位 的 二 进 制 数 
10000100001110011001101001100 


图 5-6 用 DX:AX 分 解 32 位 二 进 制 数 示意 图 110。 在 做 除法 之 前 ， 先 要 分 成 两 段 
进行 切割 "， 以 分 别 装 入 寄存 器 DX 
和 AX 。 为 了 方便 ， 我 们 通常 用 *DX:AX" 来 描述 32 位 的 被 除数 。 
同时 ， 除 数 可 以 由 16 位 的 通用 寄存 器 或 者 内 存单 元 提供 ， 指 令 执行 
后 ， 商 在 AX 中 ， 余 数 在 DX 中 。 比 如 下 面 的 指令 : 


Gl ve 


GT Worgd 110x02 301 


源 程 序 第 45 行 把 0 传送 到 DX 寄存 器 ， 这 意味 着 ， 我 们 是 想 把 
DX:AX 作为 被 除数 ， 即 被 除数 的 高 16 位 是 全 零 。 人 至 于 被 除数 的 低 16 
位 ， 已 经 在 第 37 行 的 代码 中 被 置 为 标志 number 的 汇编 地 址 。 


回 到 前 面 的 第 38 行 ， 该 指令 把 10 作为 除数 传送 到 通用 寄存 器 BX 


一 切 都 准备 好 了， 产程 序 第 46 行 ，div 指令 用 DX:AX 作为 被 除数 ， 
除 以 BX 的 内 容 ， 执 行 后 得 到 的 商 在 AX 中 ， 人 余数 在 DX 中 。 因 为 除数 是 
10， 余 数 自然 比 10 小 ， 我 们 可 以 从 DL 中 取得 。 

第 1 次 相 除 得 到 的 余数 是 个 位 上 的 数字 ， 我 们 要 将 它 保 存 到 声明 好 的 
数据 区 中 。 所 以 ， 源 程序 第 47 行 ， 我 们 又 一 次 用 到 了 传送 指令 ， 把 寄存 
右 DL 中 的 余数 传送 到 数据 段 。 

可 以 看 到 ， 指 令 中 没有 使 用 有 段 超越 前 级 ， 所 以 处 理 占 在 执行 时 ， 默 
认 地 使 用 段 寄存 器 DS 来 访问 内 存 。 偏 移 地 址 是 由 标号 number 提供 的 ， 
它 是 数据 区 的 首 地 址 ， 也 可 以 说 是 数据 区 中 第 一 个 数据 的 地 址 。 因 此 ， 
number 和 number+0x00 是 一 样 的 ， 没 有 区 别 。 


因为 我 们 访问 的 是 number 所 指 回 的 内 存单 元 ， 故 要 用 中 括 亏 围 起 
令 人 不 解 的 是 ， 第 47 行 中 ， 仿 移 地 址 并 非 理 论 上 的 number+0x00 
， 而 是 0x7c00+ number+0x00。 这 个 0x7c00 是 从 哪里 来 的 呢 ? 


标号 number 所 代表 的 汇编 地 址 ， 其 数值 是 在 源 程序 编译 阶段 确定 
的 ， 而 且 是 相对 于 整个 程序 的 开头 ， 从 0 开始 计算 的 。 请 看 一 下 表 5-3 的 
第 37 行 ， 这 个 在 编译 阶段 计算 出 来 的 值 是 0x012E。 在 运行 的 时 候 ， 如 果 
该 程序 被 加 载 到 某 个 段 内 偏 移 地 址 为 0 的 地 方 ， 这 不 会 有 什么 问题 ， 因 为 
它们 是 一 致 的 。 

但 是 ， 事 实 上 ， 如 图 5-7 所 示 ， 这 里 显示 的 是 整个 0x0000 段 ， 其 中 
深 色 部 分 为 主 引导 扇 区 所 处 的 位 置 。 主 引导 扇 区 代码 是 被 加 载 到 
0x0000:0x7C00 处 的 ， 而 非 0x0000:0x0000。 对 于 程序 的 执行 来 说 ， 这 
不 会 有 什么 问题 ， 因 为 主 引 导 局 区 的 内 容 补 加 载 到 内 存 中 并 开始 执行 
时 ，CS=0x0000，1IP=0x7C00。 


number: 


段 : 0000 


64KB 
012E 





:7C00 
7C00T-012E=7D2E 


0000: 0000 | | | 


图 5-7 ” 主 引 导 程序 加 载 到 内 存 后 的 地 址 变化 
加 载 位 置 的 改变 不 会 对 处 理 器 执行 指令 造成 任何 困扰 ， 但 会 给 数据 访问 
禹 来 厂 烦 。 要 知道 ， 当 前 
数据 段 寄 存 器 DS 的 内 容 是 0x0000， 因 此 ，number 的 偏 移 地 址 实际 上 是 
0x012E+0x7C00=0x7D2E。 当 正在 执行 的 指令 仍然 用 0x012E 来 访问 数 
据 ， 灾 难 束 发 生 了 。 

所 以 ， 在 编写 主 引 导 扇 区 程序 时 ， 我 们 就 要 考虑 到 这 一 点 ， 必 须 把 
代码 写成 


TO [IOx teQ0tnomber+0Ox00l el 


指令 中 的 目的 操作 数 是 在 编 详 阶 段 确定 的 ， 因 此 ， 在 编 详 阶 段 ， 编 
详 右 同样 会 首先 将 它 转 换 成 以 下 的 形式 ， 再 进一步 生成 机 各 但 : 


mov [O71dZ2€e| dl 


这 样 ， 如 表 5-3 的 第 47 行 所 示 ， 在 编译 后 ， 编 译 器 就 会 将 这 条 指令 
编译 成 88 16 2E 7D， 其 中 前 两 个 字 节 是 操作 人 码 ， 后 两 个 字 节 是 低 端 字 节 
序 的 0x7D2E。 当 这 条 指令 执行 时 ， 处 理 器 将 段 寄 存 器 DS 的 内 容 (和 CS 


一 样 ， 是 0x0000) 左 移 4 位 ， 再 加 上 指令 中 提供 的 偏 移 地 址 0x7D2E， 束 
得 到 了 实际 的 物理 地 址 (0x07D2E) 。 


天 于 这 条 指令 的 咏 外 一 个 问题 是， 虽然 目的 操作 数 也 是 一 个 内 存单 
元 地 址 ， 但 并 没有 用 关键 字 “byte" 来 修饰 。 这 是 因为 源 操作 数 是 寄存 砷 
DL， 编 详 套 可 以 据 此 推 产 这 是 一 个 字 节 操作 ， 不 存在 坚 义 。 


现在 已 经 得 到 并 保存 了 个 位 上 的 数字 ， 下 一 步 是 计算 十 位 上 的 数 
字 ， 方 法 是 用 上 一 次 得 到 的 商 作 为 被 除数 ， 继 续 除 以 10。 恰 好 ，AX 已 经 
是 被 除数 的 低 16 位 ， 现 在 只 需要 把 DX 的 内 容 清 零 即 可 。 

为 此 ， 代 码 清 单 5-1 第 50 行 ， 用 了 一 个 新 的 指令 xor 来 将 DX 寄存 器 
的 内 容 清 零 。 

xor， 在 数字 逻辑 里 是 异 或 (eXclusive OR) 的 意思 ， 或 者 叫 互 斥 
或 、 互 斥 的 或 运算 。《 在 穿越 计算 机 的 迷 筋 》 里 ， 已 经 伦 了 大 量 的 篇 幅 
讲解 数字 逻辑 。 在 数字 逻辑 里 ， 如 果 0 代表 假 ，1 代表 真 ， 那 么 


0 xor 0 = 0 
0 xor 1 = 1 
1 Xr 0 = 1 
1] xor 1] = 0 


xor 指令 的 目的 操作 数 可 以 是 明 用 寄存 如 和 内 存 早 元 ， 源 操作 数 可 以 
是 退 用 寄存 占 、 内 存 蛙 元 和 立即 数 (不 允 许 两 个 操作 数 同时 为 内 存单 
元 ) 。 和 而 且 ， 寞 或 操作 十 在 两 个 操作 数 相对 应 的 比特 之 同时 独 进行 的 。 

一 般 地 ，xor 指令 的 两 个 操作 数 应 当 具 有 相同 的 数据 宽度 。 因 此 ， 其 
指令 税 陈 可 以 总 结 为 以 下 几 种 情况 : 


xor 8 位 通用 寄存 器 ,8 位 立即 数 ， 例 如 : xor al, 0x55 
xor 8 位 通用 寄存 占 , 指 癌 8 位 实际 操作 数 的 内 存 地 址 ， 例 如 : xor cl, [0x2000] 
xor 8 位 通用 寄存 器 ,8 位 通用 寄存 器 ， 例 如 : xor bl,dl 


xor 16 位 通用 寄存 器 , 16 位 立即 数 ， 例 如 : xor ax, 0xf033 
xor 16 位 通用 寄存 器 ， 指 癌 16 位 实际 操作 数 的 内 存 地 址 ， 例 如 : xor bx, [0x2002] 
xor 16 位 通用 寄存 器 , 16 位 通用 寄存 器 ， 例 如 : xor dx, bx 


xor 指向 8 位 实际 操作 数 的 内 存 地 址 , 8 位 立即 数 ， 例 如 : xor byte [0x3000],0xf0 
xor 指 问 8 位 实际 操作 数 的 内 存 地 址 , 8 位 通用 寄存 器 ， 例如: xor [0x06],al 


xor 指 问 16 位 实际 操作 数 的 内 存 地 址 , 16 位 立即 数 ， 例 如 : xor word [0x2002]，,0x55aa 
xor 指向 16 位 实际 操作 数 的 内 存 地 址 , 16 位 通用 寄存 器 ， 例 如 : xor [0x20]，, dx 


因为 异 或 操作 是 在 两 个 操作 数 相 对 应 的 比特 之 间 单 独 进 行 ， 故 ， 以 
下 指令 执行 后 ，AX 寄存 磊 中 的 内 容 为 0xXFOF3。 


mov ax,0000 0000 0000 0010B 
xor axl111 0000 1111 O001B To io Mi, OREOFS 


注意 ， 这 两 条 指令 的 源 操作 数 都 采用 了 二 进 制 数 的 写法 ，NASM 编 
译 器 允许 使 用 下 画 线 来 分 开 它们 ， 好 处 是 可 以 更 清楚 地 观察 到 那些 感 兴 
趣 的 比特 。 


回 到 当前 程序 中 ， 因 为 指令 xor dx,dx 中 的 目的 操作 数 和 源 操作 数 相 
同 ， 那 么 ， 不 管 DX 中 的 内 容 是 什么 ， 两 个 相同 的 数字 异 或 ， 其 结果 必定 
为 0， 故 这 相当 于 将 DX 清 零 。 

值得 一 提 的 是 ， 尺 官 都 可 以 用 于 将 寄存 右 清 零 ， 但 是 编译 后 ，mov 
dx,0 的 机 器 码 是 BA 00 00; 而 xor dx,dx 的 机 器 码 则 是 31 D2， 不 但 较 
短 ， 而 且 ， 因 为 xor dx,dx 的 两 个 操作 数 都 是 通用 寄存 右 ， 所 以 执行 速度 
最 快 。 

第 二 次 相 除 的 结果 可 以 求 得 十 位 上 的 数字 ， 源 程序 第 52 行 用 来 将 十 
位 上 的 数字 保存 到 从 number 开始 的 第 2 个 存储 单元 里 ， 即 
number+Ox01, 

从 源 程 序 第 55 行 开始 ， 一 直到 第 67 行 ， 做 的 都 是 和 前 面相 同 的 事 
情 ， 即 ， 分 解 各 位 上 的 数字 ， 并 了 予以 保存 ， 这 里 不 再 北 述 。 


5.5.5 ”显示 分 解 出 来 的 各 个 数位 


经 过 5 次 除法 操作 ， 可 以 将 寄存 器 AX 中 的 数 分 解 成 单独 的 数位 ， 下 
面 的 任务 是 将 这 些 数位 显示 出 来 ， 方 法 站 从 DS 指 同 的 数据 段 依 次 取出 这 
些 数 位 ， 并 与 入 ES 指 问 的 附加 段 (显示 绥 冲 区 ) 。 


因为 在 分 解 并 保存 各 个 数位 的 时 候 ， 顺 序 是“ 个、 十 、 百 、 和 二、 万” 
位 ， 当 在 屏幕 上 显示 时 ， 却 要 反 过 来 ， 先 显示 万 位 ， 再 显示 王位， 等 
等 ， 因 为 屏幕 显示 是 从 左 往 右 进 行 的 。 所 以 ， 源 程序 第 70 行 ， 先 从 数据 
段 中 ， 偏 移 地 址 为 number+0x04 处 取得 万 位 上 的 数字 ， 传 送 到 AL 寄存 
器 。 当 然 ， 因 为 程序 是 加 载 到 0x0000:0x7C00 处 的 ， 所 以 正确 的 偏 移 地 
址 是 0x7C00+number+0x04。 


然后 ， 源 程序 第 71 行 ， 将 AL 中 的 内 容 加 上 0x30， 以 得 到 与 该 数字 
对 应 的 ASCI 代码 。 在 这 里 ，add 是 加 法 指令 ， 用 于 将 一 个 数 与 男 一 个 数 
相 加 。 


add 指令 需要 两 个 操作 数 ， 目 的 操作 数 可 以 是 8 位 或 者 16 位 的 通用 
宕 人 存货， 或 者 指 癌 8 位 或 者 16 位 实际 操作 数 的 内 存 地 址 ， 源 操作 数 可 以 
症 相 同 数据 宽度 的 8 位 或 者 16 位 退 用 寄存 锅 、 指 癌 8 位 或 者 16 位 实际 操 
作 数 的 内 存 地 址 ， 或 者 立即 数 ， 但 不 允许 两 个 操作 数 同 时 为 内 存单 元 。 
相 加 后 ， 结 琳 你 存在 目的 操作 数 中 。 比 如 : 





sa all ; 寄存 右 AL 和 CL 中 的 内 容 相 加 ， 结 果 在 AL 中 

add Bx, Ox123F ;寄存 器 AX 的 内 容 和 立即 数 0x123F 相 加 ， 结 果 在 AX 中 
add [label alyex ; 内 存单 元 的 字 和 寄存 器 CX 的 内 容 相 加 ， 结 果 写 回 内 存单 元 
RSI ; 寄存 如 AX 的 内 容 和 内 存单 元 的 学 相 加 ， 结 果 在 AX 中 

add Byte [label a],0x08 ; 内 存单 元 的 字 节 和 立即 数 0x08 相 加 ， 结 果 写 回 内 存单 元 


源 程序 第 72 行 ， 将 要 显示 的 ASCII 代码 传送 到 显示 缓冲 区 偏 移 地 址 
为 Ox1A 的 位 置 ， 该 位 置 紧 接 着 前 面 的 字符 串 “Label offset:”"。 显 示 绥 冲 区 
是 由 段 寄存 器 ES 指向 的 ， 因 此 使 用 了 上 段 超 越前 级 。 


源 程序 第 73 行 ， 将 该 字符 的 显示 属性 写 入 下 一 个 内 存 位 置 0Xx1B。 属 


性 值 0x04 的 意思 是 黑 撒 红字， 无 闪烁 ， 无 加 蜗 。 
从 源 程序 的 第 75 行 开始 ， 到 第 93 行 ， 用 于 显示 其 他 4 个 数位 。 
源 程 序 第 95、96 行 ， 用 于 以 黑 展 白字 显示 字符 "D”， 意 思 是 所 最 未 
的 数字 十 十 进 制 的 。 


检测 后 5.3 


1. ”INTEL x86 处 理 器 访问 内 存 时 ， 是 按 低 端 字 节 序 进 行 的 。 那 么 ， 
以 下 程序 户 基 执行 后 ， 寄 存 秦 AX 中 的 内 容 是 多 少 ? 
mov word [datal,0x2008 
xor byte [datal,O0x05 
add word [datal,0x0101 
mov ax.,[datal 


data db 0,0 


2. 对 于 以 上 程序 片断 ， 如 果 标 号 data 在 编译 时 的 汇编 地 址 是 
0x0030， 那 么 ， 妆 该 程序 加 载 到 内 存 后 ， 访 程序 厂 断 所 在 段 的 段 地 址 为 
0x9020 时 ， 该 标号 处 的 段 内 偏 移 地 址 和 物理 内 存 地 址 各 是 多 少 ? 


3. 对 于 以 下 指令 的 写法 ， 谨 出 哪些 是 正确 的 ， 哪 些 是 错误 的 ， 错 误 
的 原因 是 什么 。 


A.mov ax,|dqata1 | B.div [data1 C.xor ax,dx 

D.div byte [data2] E.xor al,[data3] F.add 
[data4],0x05 

G.xor Oxff,0x55 H.add Ox06,al |.div Oxf0 

J.add ax,cl| 


4. 如 果 寄 存 器 AX、BX 和 DX 的 内 容 分 别 为 0xXA000、0x9000 和 
0x0001， 那 么 ， 执 行 div bh 后 ， 这 三 个 寄存 器 的 内 容 各 是 多 少 ? 执行 div 
bx 后 蛇 ? 


5.6 ”使 程序 进入 无 限 循环 状态 


数字 显示 完成 后 ， 原 则 上 人 整个 程序 惑 结束 了 了， 但 对 处 理 融 来 访 ， 它 
并 不 知道 。 对 它 来 说 ， 取 指令 、 执 行 古 水 无 止境 的 。 程 序 有 大 小 ， 执 行 
无 俘 轧 ， 它 这 么 做 的 结 东 ， 融 是 会 执行 到 后 面 非 指 令 的 数据 上 ， 然 


问题 在 于 我 们 现在 的 确 无 事 可 做 。 为 避免 发 生 问 题 ， 源 程序 第 98 
行 ， 安 排 了 一 个 无 限 循环 : 


infi: JjJmp near infi 


jmp 是 转移 指令 ， 用 于 使 处 理 器 脱离 当前 的 执行 序列 ， 转 移 到 指定 
的 地 方 执行 ， 关 键 字 near 表 示 目 标 位 置 依然 在 当前 代码 段 内 。 上 面 这 条 
指令 唯一 特殊 的 地 方 在 于 它 不 是 转移 到 别处 ， 而 是 转移 到 目 己 。 也 就 是 
说 ， 它 将 会 不 停 地 重复 执行 自己 。 不 要 觉得 奇怪 ， 这 是 允许 的 。 

处 理 需 取 指 令 、 执 行 指 令 是 依赖 于 段 寄 存 咒 CS 和 指令 指针 寄存 郁 IP 
的 ，8086 处 理 器 取 指 令 时 ， 把 CS 的 内 容 左 移 4 位 ， 加 上 IP 的 内 容 ， 形 
成 20 位 的 物理 地 址 ， 取 得 指令 ， 然 后 执行 ， 同 时 把 IP 的 内 容 加 上 当前 指 
令 的 长 度 ， 以 指 问 下 一 条 指令 的 偏 移 地 址 。 

但 是 ， 一 旦 处 理 嚣 取 到 的 是 转移 指令 ， 情 况 束 完全 变 了 。 

很 容易 想到 ， 指 令 jmp near infi 的 意图 是 转移 到 标号 infi 所 在 的 位 置 
执行 。 可 是 ， 正 如 我 们 前 面 所 说 的 ， 程 序 在 内 存 中 的 加 载 位 置 是 
0x0000:0x7C00， 所 以 ， 这 条 指令 应 当 写 成 


Jmp near Ox/7/cO00+infi 


实际 上 ， 不 加 还 好 ， 加 上 了 0x7C00， 就 完全 错 了 。 


jmp 指令 有 多 种 格式 。 最 典型 地 ， 它 的 操作 数 可 以 是 直接 给 出 的 段 
地 址 和 偏 移 地 址 ， 这 称 为 绝对 地 址 。 比 如 : 


ms ‘00x5000 50xf0e0 


此 时 ， 要 转移 到 的 目标 位 置 是 非常 明确 的 ， 即 ， 上 段 地 址 为 0x5000， 
段 内 偏 移 地 址 为 0xf0c0。 在 这 种 情况 下 ， 指 令 的 控 作 人 码 为 0xXEA， 故 完整 
的 机 需 指 令 是 : 


RA CO FQ 00 0 


处 理 器 执行 时 ， 发 现 操作 码 为 0xEA， 于 是 ， 将 指令 中 给 出 的 段 地址 
传送 到 有 段 寄存 右 CS; 将 偏 移 地 址 传送 到 指令 指针 寄存 占 IP， 从 而 转移 到 
目标 位 略 处 接 看 执行 。 


但 是 ， 在 此 处 ，jmp 指令 使 用 了 关键 字 “near"”， 且 操作 数 是 以 标号 
Cinfi ) 的 形式 给 出 。 这 很 容易 让 我 们 想到 ， 这 又 是 另 一 种 形式 的 转移 指 
令 ， 转 移 的 目标 位 置 处 在 当前 代码 段 内 ， 指 令 中 的 操作 数 应 当 是 目标 位 
置 的 偏 移 地 址 。 实 际 上 ， 这 是 不 正确 的 。 


实际 上 ， 这 是 一 个 3 字 贡 指令， 操作 人 码 是 0xXE9， 后 跟 一 个 16 位 《两 
字 市 ) 的 操作 数 。 但 是 ， 该 操作 数 并 非 目标 位 置 的 偏 移 地 址 ， 而 是 日 标 
位 置 相 对 于 当前 指令 处 的 偏 移 量 〈 以 字 节 为 早 位 〉。 在 编译 阶段 ， 编 译 
器 是 这 么 做 的 : 用 标号 (目标 位 置 ) 处 的 汇编 地 址 减 去 当前 指令 的 汇编 
地 址 ， 再 减 去 当前 指令 的 长 度 (3) ， 就 得 到 了 jmp near infi 指令 的 实际 
操作 数 。 也 不 是 编译 右 愿 意 费 这 个 事 ， 这 是 处 理 右 的 要 求 。 这 样 看 米 ， 
jmp near infi 的 机 器 指令 格式 和 它 的 汇编 指令 格式 完全 不 同 ， 鼎 具 迷 惑 
性 ， 所 以 一 定 要 认 清 它 的 本 质 。 这 种 转移 是 相对 的 ， 操 作 数 是 一 个 相对 
量 ， 如 果 你 人 为 地 加 上 0x7C00， 那 反而 不 对 了 。 

那么 ， 编 译 故 是 如 何 区 分 这 两 种 不 同 的 转移 方式 呢 ? 很 简单 ， 当 它 
看 到 JMP 之 后 是 一 个 绝对 地 址 ， 如 0xF000:0x2000 时 ， 它 就 知道 应 当 编 
详 成 使 用 操作 码 0xEA 有 的 直接 绝对 转移 指令 。 相 反 地 ， 如 果 它 发 现 JMP 
之 后 是 一 个 标 写 ， 那 么 ， 它 就 会 编译 成 使 用 操作 人 码 为 0xE9 的 相对 转移 指 
令 。 关 键 字 “near 不 是 最 主要 的 ， 它 仅仅 用 于 指示 相对 量 是 16 位 的 。 

在 这 里 ， 上 目标 位 置 束 是 当前 指令 上 自己 的 位 置 ， 间 隔 的 长 度 为 0。 再 用 
0 减 去 当前 指令 长 度 3， 这 是 一 个 负数 。 打 开 Windows 计算 器 程序 ， 实 际 
减 一 下 看 看 ， 你 会 发 现 ， 用 二 进 制 的 0 减 去 三 进 制 的 11， 结 果 是 


RE 于 


由 于 是 在 不 断 地 向 左边 借 位 ， 除 了 最 右边 是 01 外 ， 左 边 都 是 无 休止 
的 “1 


再 切换 到 十 六 进 制 计 算 一 下 0x0 减 去 0x3， 结 集 古 
SR 和 


同样 由 于 是 在 不 断 地 同志 边 信 位 ， 除 了 最 右边 是 D 外 ， 左 边 痢 是 无 
休止 的 F。 


由 于 在 指令 中 使 用 了 near 关键 字 ， 因 此 ， 以 上 无 休止 的 结果 将 被 截 
断 ， 只 保留 右边 16 位 ， 即 0xFFFD 。 又 因为 X86 处 理 器 使 用 低 端 字 节 
序 ， 所 以 ，jimp near infi 指令 编译 后 的 机 器 代码 为 E9 FD FF。 


你 可 能 党 得 疑惑 : 0xFFFD 等 于 十 进 制 数 65533， 而 这 条 指令 需要 的 
操作 数 实际 是 负 3， 我 们 这 样 做 的 原理 是 什么 呢 ? 计 算 机 又 是 怎么 表示 人 负 
数 的 呢 ? 不 要 着 急 ， 下 一 章 我 们 束 要 介绍 负数 ， 并 回 过 头 来 重新 认识 这 
个 问题 。 

在 指令 执行 阶段 ， 处 理 器 用 指令 指针 等 存 器 IP 的 内 容 加 上 该 指令 的 
操作 数 ， 再 加 上 该 指令 的 长 度 (3) ， 就 得 到 了 要 转移 的 实际 偏 移 地 址 ， 
同时 CS 寄存 器 的 内 容 不 变 。 因 为 改变 了 IP 的 内 容 ， 这 直接 导致 处 理 需 
的 指令 执行 流程 转 问 目标 位 置 。 

束 jmp near infi 指令 来 说 ， 当 它 执 行 时 ， 转 移 到 的 目标 位 置 是 IP 十 
0xFFFD 十 3。 用 Windows 计 算 需 程序 实际 做 一 下 ，0xFFFD 十 3 的 结果 是 
0x10000， 但 处 理 器 只 使 用 16 位 的 偏 移 地 址 ， 故 只 保留 16 位 的 结 
0x0000。 因 此 传送 到 指令 指针 寄存 器 IP 的 内 容 依 然 是 它 原来 的 内 容 ， 这 
导致 处 理 噩 和 册 次 执行 当前 指令 。 

jmp 指令 具有 多 种 格式 ， 我 们 现在 所 用 的 ， 只 是 其 中 的 一 种 ， 叫 做 
相对 近 转 移 。 有 关 其 他 格式 ， 以 及 这 些 格式 之 间 的 差异 ， 我 们 将 在 后 面 
的 章节 里 结合 具体 的 实例 进行 讲解 。 

检测 点 5.4 


写 出 以 下 程序 片断 中 那 两 条 JMP 指令 的 机 器 指令 码 ， 并 在 NASMIDE 
中 编译 验证 你 的 答案 是 否 正 确 : 


jmp near start ( ) 

data db Ox55,0xaa 

start: mov ax,0 

jmp Ox2000:0x0005 () 


5.7 ”完成 并 编 详 主 引 寻 鹿 区 代码 


5.7.1 主 引 导 届 区 有 效 标志 


主 引 导 局 区 在 系统 启动 过 程 中 扮演 着 承上启下 的 角色 ， 但 并 非 是 唯 
一 的 选择 。 如 果 人 硬盘 的 主 引导 扇 区 不 可 用 ， 系 统 还 有 其 他 选择 ， 比 如 可 
以 从 光盘 和 U 盘 启 动 。 

然而 ， 如 果 不 试 试 水 的 深浅 就 一 个 独子 扎 下 池塘 ， 这 并 非 一 个 明智 
之 举 。 同 样 地 ， 如 果 主 引导 局 区 是 无 效 的 ， 上 面 并 非 是 一 些 处 理 器 可 以 
识别 的 指令 ， 而 处 理 器 又 不 加 鉴别 地 执行 了 它 ， 其 结果 是 陷入 宕 机 状 
人 态 ， 更 不 要 提 从 其 他 设备 启动 了 。 

为 些 ， 计 算 机 的 设计 者 们 决定 ， 一 个 有 效 的 主 引 导 届 区 ， 其 最 后 两 
个 字 节 的 数据 必须 是 0x55 和 0xAA。 否 则 ， 这 个 扇 区 里 保存 的 就 不 是 一 些 
有 意 而 为 的 数据 。 

定义 这 两 个 字 节 很 简单 ， 伪 指令 db 和 dw 就 可 以 实现 。 源 程序 第 103 
行 就 是 db 版 本 的 实现 ， 但 没有 标号 。 标 号 的 作用 是 提供 当前 位 置 的 汇编 
( 偏 移 ) 地 址 供 其 他 指令 引用 ， 如 果 没 有 任何 指令 引用 这 个 地 址 ， 标 号 
可 以 省 略 。 这 是 两 个 单独 的 字 节 ， 上 所 以 0x55 在 前 ，0xAA 在 后 ， 即 使 编 
译 之 后 也 是 这 个 顺序 。 


但 是 ， 如 果 采 用 dw 版 本 ， 应 该 这 样 写 : 
dw 0XaaD5 


因为 ， 在 Intel 处 理 右 上， 将 一 个 字 写 入 内 存 时 ， 是 灯 用 低 病 字 市 序 
的 ， 低 字 节 0x55 置 入 低地 址 端 ( 在 前) ， 高 字 节 0xAA 在 高 地 址 端 ( 在 
后 ) 。 

矿 烦 在 于 ， 如 何 使 这 两 个 字 节 正好 位 于 512 字 节 的 最 后 。 前 面 的 代 
公有 多 少 个 字 节 我 们 不 知道 ， 那 是 由 NASM 编译 器 计算 和 跟踪 的 。 

我 们 当然 有 非常 好 的 办 法 ， 但 还 不 宜 在 这 里 说 明 。 但 是 ， 经 过 计算 
和 尝试 ， 我 知道 ， 在 前 面 的 内 容 和 结尾 的 0xXAA55 之 间 ， 有 203 字 节 的 空 
洞 。 因 此 ， 源 程序 的 第 102 行 ， 用 于 声明 203 为 0 的 数值 来 填补 。 


为 了 方便 ， 伪 指令 times 可 用 于 重复 它 后面 的 指令 和 奉 干 次 。 比 如 


将 在 编译 时 重复 生成 mov ax,bx 指令 20 次 ， 即 重复 该 指令 的 机 器 
(89 D8) 20 次 。 


因此 
times 203 db 0 


将 会 在 编译 时 保留 203 个 为 0 的 字 节 。 
5.7.2 ”代码 的 保存 和 编译 


本 章 的 代码 是 现成 的 ， 配 书 源 代码 解压 缩 之 后 ， 可 以 在 文件 夹 "c05” 
里 找到 ， 文 件 名 为 c05 mbrasm 。 打 开 该 文件 ， 将 其 编译 成 
cuD mbr.bin。 


该 文件 的 大 小 为 512 字 节 ， 可 以 用 配 书 工具 HexView 来 查看 其 内 
如 图 5-8 所 示 。 
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图 5-8 ”用 配 书 工具 et 查看 c05 mbr. bin 的 内 容 


显而易见 ， 在 编 详 之 后 ， 源 程序 中 的 标 写 、 注 释 、 伪 指令 部 统统 消 
失 了 ， 只 剩 下 纯粹 的 机 硕 指 令 和 数据 。 那 些 需要 在 编 诺 阶段 决定 的 央 
容 ， 也 都 有 了 确切 的 值 。 


5.8 加载 和 运行 主 引 寻 届 区 代码 
5.8.1 把 编译 后 的 指令 写 入 主 引 导 届 区 


在 第 4 章 ， 我 们 已 经 安装 了 VirtualBox 虚拟 机 软件 ， 并 在 它 里 面 创建 
了 一 台 名 为 LEARNASM 的 虚拟 计算 机 。 除 此 之 外 ， 还 为 它 创 建 了 一 块 虚 
拟人 硬盘 。 


虚拟 硬盘 其 实 是 一 个 扩展 名 为 “.vhd” 的 Windows 文件 ， 具 体 的 文件 
名 和 创建 位 置 只 有 你 目 己 知道 。 但 是 ， 无 论 如 何 ， 你 现在 都 可 以 将 我 们 
刚刚 纺 详 好 的 代码 与 入 这 个 虚拟 硬盘 的 主 引 导 刷 区 里 。 


首先 局 动 配 书 工具 FixVhdWr， 在 第 一 个 界面 内 选择 虚拟 便 租 文件 。 
注意 ， 要 写 入 的 那个 虚拟 硬盘 ， 必 须 是 VirtualBox 虚拟 机 使 用 的 硬盘。 人 否 
则 的 话 ， 虚 拟 机 怎么 可 能 执行 到 你 写 入 的 程序 呢 ! 

接着 ， 在 第 二 个 界面 内 ， 要 选择 刚才 编译 好 的 二 进 制 文件 
c05_mbr.bin， 然 后 再 进入 下 一 个 界面 。 第 三 个 界面 开始 将 指定 的 文件 写 
入 虚拟 便 往 。 注 意 保 持 默 认 的 写 入 方式 〈 即 "LBA 连续 直 写 模式 ”) ， 当 出 
现 红色 字体 的 “数据 写 入 完成 ， 本 次 共 操 作 了 1 个 夯 区 ?时 ， 说 明 数 据 的 写 
入 已 经 完成 。 最 后 要 区 竺 一句， 二 万 不 要 在 虚拟 计算 机 LEARN-ASM 运 
行 的 时 候 进 行 数据 写 入 操作 ， 因 为 虚拟 硬盘 文件 正 被 VirtualBox 以 独占 的 
方式 使 用 。 人 否则 的 话 ， 会 导致 数据 写 入 失败 。 


5.8.2 ”启动 虚拟 机 观察 运行 结果 

在 Virtual Box 软件 的 主 界面 上 上， 选择 "LEARN-ASM?" 计 算 机 ， 然 后 单 
击 “ 运 行 " 按 钮 。 

最 后 ， 如 果 一 切 顺 利 的 话 ， 程 序 的 运行 效果 如 图 5-9 所 示 。 





LEARN-ASM [正在 运行 ] - Oracle VM VirtualBox 二 | [| | 三 Rs 











O29@ 9 WRisht Ctrl 





图 5-9 本 章程 序 在 虚拟 计算 机 中 的 运行 效果 


5.9 程序 的 调试 技术 


5.9.1 开源 的 Bochs 虚拟 机 软件 


程序 员 的 工作 束 像 是 在 历险 ， 困 难 香 曾 ， 途中 不 可 避免 地 要 过 上 了 暗 
礁 。 有 时 候 ， 少 了 一 个 字符， 或 者 多 了 一 个 字符 ， 或 者 拼 错 了 字符 ， 程 
序 束 无 法 成 功 编 详 ;， 有 了 时候， 尺 官 能 够 编译 ， 但 程序 中 存在 地 辑 错 误 ， 
要 么 少 号 了 了 语句， 要 么 算法 个 对 ， 运 行 的 时 候 也 得 个 到 正确 结 琳 。 


有 时 候 ， 错 误 的 原因 很 简单 ， 束 是 因为 马虎 和 误 操 作 ， 但 很 难 知 道 
问题 出 在 哪里 。 等 到 你 终于 发 现 的 时 候 ， 一 天 ， 甚 至 几 天 的 时 间 已 经 花 
掉 了 。 在 这 种 情况 下 ， 没 有 调试 工具 来 找到 程序 中 隐藏 的 错误 是 不 行 
的 。 有 时候 ， 即 使 有 调试 工具 的 帮助 ， 也 会 令 人 筋疲力尽 ， 不 过 有 总 比 
没有 好 。 在 现实 的 世界 里 ， 不 管 是 经 验 老道 的 程序 设计 师 ， 还 是 刚 入 门 
的 新 手 ， 没 有 谁 敢 说 自己 的 程序 是 不 需要 调试 的 。 

调试 工具 并 不 是 智能 到 可 以 自动 发 现 程序 中 的 错误 ， 这 是 不 可 能 
的 。 但 是 ， 它 可 以 单 步 执行 你 的 程序 (每 执行 一 条 指令 后 就 停 下 来 )， 
或 者 允许 你 在 程序 中 设置 断 点 ， 当 它 执 行 到 上 断 点 位 置 时 就 停 下 来 。 这 
时 ， 它 可 以 显示 处 理 器 各 个 寄存 器 的 内 容 ， 或 者 内 存单 元 里 的 内 容 。 因 
此 ， 你 可 以 根据 机 器 的 状态 来 判断 程序 的 执行 结果 是 否 达到 了 预期 。 通 
过 这 种 方式 ， 你 可 以 逐步 逼近 出 现 问 题 的 地 方 ， 直 到 最 终 发 现 问 题 的 所 
在 。 市 面 上 有 多 种 流行 的 程序 调试 工具 软件 ， 但 它们 通常 都 像 你 用 的 其 
他 软件 一 样 工作 在 操作 系统 之 上 。 

厂 烦 的 是 ， 本 书 中 的 程序 全 都 只 能 运行 在 没有 操作 系统 的 裸 机 下 。 
这 意味 着 ， 所 有 流行 的 调试 工具 都 不 可 用 。 不 过 ， 好 消 晨 是， 一 球 叫 做 
Bochs 的 软件 可 以 帮助 你 。 


Bochs 是 开源 软件 ， 是 你 唯一 可 选择 的 调试 器 。 开源 意味 着 ， 你 不 
用 花 钱 购买 束 可 以 使 用 它 。 它 用 软件 来 模拟 处 理 器 取 指 令 和 执行 指令 的 
过 程 ， 以 及 整个 计算 机 硬件 。 当 它 开始 运行 时 ， 束 直接 模拟 计算 机 的 加 
电 启动 过 程 。 正 是 因为 如 此 ， 它 才 有 可 能 做 一 些 调试 工作 。 

很 重要 有 的 一 点 是 ， 它 本 和 映 束 是 一 个 虚拟 机 ， 类 似 于 VirtualBox。 
此 ， 它 也 就 很 容易 让 你 单 步 跟踪 人 硬盘 的 启动 过 程 ， 查 看 寄存 器 的 内 容 和 


机 邢 状 态 。 在 本 书 中 ， 我 们 的 程序 都 是 直接 从 BIOS 那里 接 省 处 理 占 的 控 
制 权 ， 因 此 ，Bochs 的 这 个 特点 正好 能 够 用 来 完成 调试 工作 。 不 像 本 书 
中 使 用 的 其 他 工具 ，bochs 的 使 用 方法 在 网 上 很 容易 搜索 a 到。 


要 使 用 Bochs， 上 自 完 要 从 它 的 官网 下 载 安 竣 程 序 。 下 载 地 址 是 : 
http://sourceforge.net/projects/bochs/files/bochs/ 


在 本 书 的 配 书 文件 包 中 ， 有 一 个 关于 如 何 下 载 、 安 靖 和 配置 Bochs 
的 帮助 文 当 ， 有 WORD 和 PDF 两 种 格式 可 以 选用 。 请 按照 帮助 文档 的 说 
明 ， 安 装 和 配置 好 Bochs。 

一 般 来 说 ， 你 会 选择 VirtualBox 虚拟 机 来 观察 运行 结果 ， 而 在 调试 程 
序 时 使 用 Bochs。 因 此 ， 最 好 是 它们 共用 同一 个 虚拟 人 硬盘 文件 CVHD 文 
件 ) 。 通 过 阅读 帮助 文档 ， 你 应 该 已 经 知道 如 何 做 到 这 一 点 ， 这 里 就 不 
再 给 述 。 


5.9.2 Bochs 下 的 程序 调试 入 门 


Bochs 虚拟 机 局 动 后 ， 首 先 在 当前 的 工作 文件 夹 下 寻找 并 读 入 配置 
文件 bochsrc.bxrc， 然 后 按 它 的 参数 调整 当前 虚拟 机 的 各 种 “ 软 硬 件 ?配置 
和 工作 参数 。 

就 像 一 台 真 正 的 计算 机 一 样 ，Bochs 的 "处 理 器 ”在 加 电 之 后 ， 要 开始 
取 指 令 并 执行 指令 。 但 是 ， 与 真正 的 处 理 器 不 同 ， 如 图 5-10 所 示 ， 
Bochs 在 执行 它 司 动 之 后 的 第 一 条 指令 时 ， 会 俘 下 来 ， 等 竺 你 的 调试 命 
令 。 


3 Bochs for Windows - Console 
lolololclolololololo el 


reset of ‘cmos' plugin device by virtual method 
reset of “dma” plugin device by virtual method 
reset of ‘pic' plugin device by virtual method 
reset of ‘pit' plugin device by virtual method 
reset of ‘floppy’ plugin device by virtual method 
reset of ‘vga' plugin device by virtual method 
reset of ‘acpi' plugin deulce by virtual method 
reset of ‘1ioapic' plugin device by virtual method 
reset of ‘keyboard' plugin deulce by virtual method 
reset of ‘harddrvu' plugin device by virtual method 
reset of ‘pci_ide' plugin deulce by virtual method 
reset of ‘unmapped’ plugin device by virtual method 
reset of ‘biosdevu' plugin device by virtual method 
reset of ‘speaker' plugin deulce by virtual method 
Using system beep for output 

reset of ‘extfpuirdq' plugin device by virtual method 
reset of ‘parallel’ plugin device by virtual method 
reset of ‘serial’' plugin device by virtual method 
reset of ‘gameport’ plugin device by virtual imethod 


000000009001[SPEAK 
0000000000011[ 


] 
] 
] 
] 
] 
] 
] 
] 
] 
] 
] 
] 
] 
] 
] 
] 
] 
] 
] 
] 


reset of ‘iodebug' plugin device by virtual method 
set SIGINT handler to bx_debug_ctrlc_handler 


od 








图 5-10 Bochs 调试 器 的 启动 和 断 点 命令 的 使 用 


如 图 中 所 示 ， 命 令 窗 口 的 底部 显示 了 当前 正在 等 待 执行 的 那 条 指 
令 ， 即 "mp far f000:e05b”。 在 这 条 指令 中 ， 关 键 字 “far" 古 不 必要 的 ， 而 
且 在 Bochs 中 ， 数 值 默认 是 十 六 进 制 的 。 因 此 ， 该 指令 下 是 


mp 0Oxft000:0xe05b 


很 显然 ， 转 移 的 目标 位 置 是 ROM-BIOS 。 


在 那 一 行 的 左 侧 ， 显 示 了 该 指令 所 在 的 物理 内 存 地 址 ， 该 地 址 是 用 
方 括号 围 起 来 的 。 你 可 能 会 想 ， 它 怎么 会 是 0x00000000FFFFFFFO 呢 ? 


8086 有 20 根 地 址 线 ， 加 电 局 动 之 后 ， 代 码 段 寄存 器 〈CS) 的 内 容 
为 0xFFFF， 指 令 指 针 寄 存 堪 IP 的 内 容 为 0x0000， 因 此 ， 第 一 条 指令 的 
物理 地 址 是 20 位 的 0xXFFFF0。 但 是 ，8086 处 理 器 已 经 成 为 历史 ， 它 之 
后 的 处 理 器 都 能 够 兼容 8086 的 功能 ， 但 却 拥 有 超过 32 根 的 地 址 线 。 在 
当前 的 这 个 Bochs 虚拟 机 上 ， 地 直线 的 数量 是 32 根 。 因 此 ，Bochs 在 这 
里 用 64 位 的 宽度 来 显示 物理 地 址 。 但 是 ， 它 的 值 应 该 是 
0x00000000000FFFF0， 不 是 吗 ? 


事情 是 这 样 的 ， 和 8086 不 同 ， 现 代 处 理 需 在 加 电 局 动 时 ， 段 寄存 需 
CS 的 内 容 为 0xF000， 指 令 指针 寄存 器 IP 的 内 容 为 0xFFF0， 这 就 使 得 处 
理 器 地 址 线 的 低 20 位 同样 是 0xFFFF0。 这 还 不 算 完 ， 在 刚刚 启动 时 ， 处 
理 右 将 其 余 〈( 高 位 部 分 ) 的 地 址 线 强 制 为 高 电 平 。 因 为 当前 Bochs 虚拟 
机 的 地 址 线 是 32 根 ， 所 以 ,初始 发 出 的 物理 内 存 地 址 就 是 
0x00000000FFFFFFFO 了 。 


之 所 以 这 样 做 ， 是 因为 处 理 絮 的 设计 者 希望 把 ROM-BIOS 放 到 
4GB (32 根 地 址 线 可 提供 的 寻 址 范围 是 2% = 二 4GB) 可 寻 址 内 存 范围 的 
最 高 端 ， 这 样 ，4GB 以 下 ， 连 同 传统 的 低 端 1MB 都 是 连续 的 RAM 区 ， 
连续 的 、 不 间断 的 RAM 能 为 操作 系统 管理 内 存 带 来 方便 。 


问题 在 于 ， 计 算 机 制造 商 们 会 考虑 很 多 现实 问题 。 老 的 硬件 和 软件 
依赖 于 低 端 1MB 的 ROMBIOS 来 工作 ， 这 涉及 到 兼容 性 。 最 终 ， 这 两 个 
地 址 区 上 段 都 指 问 同一 块 ROM 心 户 。 


在 物理 地 址 的 后 边 ， 是 逻辑 地 址 ， 即 段 寄 存 器 CS 和 指令 指针 寄存 器 
IP 的 内 容 ， 是 以 十 六 进 制 显示 的 ， 等 效 于 0xf000:0xfffO0 。 在 这 一 行 的 右 
边 ，Bochs 还 以 注释 的 形式 显示 了 指令 的 机 占 代 码 ， 即 EA 5B E0 00 
F0。 


现在 的 情况 是 ，Bochs 还 没有 执行 该 指令 ， 它 需要 你 的 指示 。 此 
时 ， 你 可 以 单 步 执行 指令 。 单 步 执行 的 意思 是 ， 每 次 只 执行 一 条 指令 ， 
执行 完毕 后 再 次 停 下 来 等 待 你 的 命令 。 

单 步 执行 命令 是 “s”(step) 。 如 图 5-11 所 示 ， 输 入 “Ss” 命令 后 回 车 ， 


Bochs 执行 刚才 那 条 指令 ， 然 后 俘 下 来 ， 同 时 显示 下 一 条 即将 执行 的 指 


令 。 


fp Bochs for Windows - Console 量 “ww 5 Se = 

000066000661[ ] reset of ‘floppy' plugin device by virtual method ^| 
] reset of ‘vga' plugin deulce by virtual method 
] reset of ‘acpi' plugin device by virtual method 

] reset of ‘ioapic' plugin deulce by virtual method 

] reset of ‘keyboard' plugin device by virtual method 

] reset of ‘harddru' plugin device by virtual method 

] reset of “pcl_lide” plugin deulce by virtual method 

] reset of ‘unmapped’' plugin device by virtual method 1 


] reset of “bliosdeu” plugin deulce by virtual method 
] reset of ‘speaker’' plugin device by virtual method 
O00000000001[SPEAK] Using system beep for output 
] ] reset of ‘extfpuirq' plugin device by virtual method 
] reset of ‘parallel' plugin device by virtual method 


] reset of ‘serial' plugin deulce by virtual method 

] reset of ‘gameport’' plugin device by virtual method 
] reset of ‘iodebug' plugin device by virtual method 
] set SIGINT handler to bx_debug_ctrlc_handler 





at t+:1 
(0) [96x990000000600feg5b LI xor Bax，ax 








《bochs:2> 。 


图 5-11 ”在 Bochs 中 单 步 执行 指令 


如 图 中 所 示 ， 指 令 执 行 后 ， 下 一 条 等 得 执行 的 指令 为 xOr ax,ax， 对 
应 的 机 器 指令 码 为 31CO0， 所 在 的 物理 内 存 地 址 是 
0x00000000000FE05B。 注 意 ， 物 理 地 址 变 了 。 


现代 的 x86 处 理 器 在 加 电 后 ， 所 有 高 端的 地 址 线 都 被 强制 为 高 电 
平 ， 直 至 遇 到 并 执行 了 第 一 个 段 间 转 移 指令 。 段 间 转 移 指 令 是 在 两 个 代 
码 段 之 间 实 施 控制 转移 ， 也 就 是 同时 改变 段 寄 存 器 CS 和 指令 指针 寄存 器 
IP 的 JMP 指令 ， 像 imp 0xf000:0xe05b 就 是 一 个 典型 的 例子 。 因 此 ， 当 
该 指令 执行 后 ， 处 理 器 发 出 的 物理 地 址 就 仅仅 取决 于 CS 和 IP 了 。 


接 下 来 ， 你 可 以 继续 单 步 执行 。 但 是 ， 老 在 BIOS 中 转悠 也 没什么 意 
思 。 要 知道 ， 你 调试 的 程序 位 于 主 引 导 届 区 中 。 依 靠 单 步 执行 ， 得 什么 
时 候 才 能 执行 到 主 引导 而 区 代码 ! 


不 用 担心 ，Bochs 提供 了 断 点 指令 “b”(break) 。 所 谓 断 点 ， 就 是 事 
先 设 置 一 个 (物理 ) 内 存 地 址 ， 当 处 理 器 执行 到 这 个 地 址 时 ， 就 自动 停 
下 来 。 因 为 计算 机 局 动 后 ， 总 是 把 主 引 导 程 序 加 载 到 物理 内 存 地 址 
0x7c00 处 ， 所 以 ， 可 以 将 这 个 地 址 设 为 断 点 。 


如 图 5-12 所 示 ， 输 入 “b 0x7c00”"。 意 思 是 ， 在 处 理 器 执行 到 地 址 
0x7c00 处 的 那 条 指令 时 ， 残 集 下 来 。 然 后 ， 青 输入 命令 “C”。 


8 Bochs for Windows - Console c= | 


ololololololololololob ] reset of “uga” plugin device by virtual method 
Iolololololololololob ] reset of ‘acpi' plugin device by uirtual method 
ololololololololololob ] reset of ‘ioapic' plugin device by virtual method 
lolololololololololo bl ] reset of ‘keyboard' plugin device by virtual method 
ololololololololololo ] reset of ‘harddru' plugin device by virtual method 
ololololololololololo bl ] reset of ‘pci_ide' plugin device by virtual method 
ololololololololololo bl ] reset of ‘unmapped' plugin device by virtual method 
ololololololololololo bl ] reset of ‘biosdevu' plugin device by virtual method 
ololololololololololo bl ] reset of “speaker ”plugin device by virtual method 
6000000000600i[SPERK] Using system bee or outpu 

Lololololololololololo bl reset of ‘extfpuird' Ugin device virtual method 
ololololololololololo to - ug1 ic : al me 





Iolololololololololo bl set of 

Iolololololololololo rl ] of: ice by ui 
Iolololololololololo bl ] 下 debug' plugin devi by virtual metho 
ololololololololololo debug_ctrlc_handler 


(0) [0x00000000fffffffO] FOOO:FFFO (unk. ctxt): jmp far F000:e05b 


N = 
(oD [90x00000000000feg05sb] fo000 :eg5b (unk. ctxt)]: xor ax，Bx 





JE 


图 5-12 ”在 Bochs 中 设置 断 点 


命令 “c”(continue ) 是 持续 执行 的 意思 ， 该 命令 要 求 处 理 器 不 间 呵 
地 持续 执行 指令 。 但 是 ， 如 果 设 置 了 断 点 ， 它 就 会 在 断 点 处 停 下 来 。 
些 ， 如 图 5-13 所 示 ， 当 “ce” 命 令 执 行 后 ， 它 会 在 执行 到 物理 内 存 地 址 
0x7c00 时 停 下 来 。 











900013945241[BI0S 
000013945821[HMEHO 
IQ0001396719i[BIOS 
"EFA bp 
四 600013999161[BIOS ] 
0900014013371[PCI ] 
90900014020651[BI0OS ] 
900015296821[UBI0OS1] 


xp $ 

Mo0001529753i[BXUGA] 
QQ00015297851[BxXUGA] 
00001532710i[UBIOS] 


RSH : Resuming from System Management Mode 
ppb eno SMRAN control register to Qx0a 
MP table addr=Oxooofas510 MPC table addr=QxQ00fa440 size=0OQxc8 
SMBIOS table addr=0QxQ00faS20 

allocate block: block=Qx1f used Ox2 of OQx20 

ACPI tables: RSDP addr=Oxooofa640 ACPI DATA addr: 





DOxolffooo00 


Firmware waking vector 0Ox1ffog0cc 

H4QOFX PMC write to PAM register 59 (TLB Flush) 
bios_table_cur_addr: 0x000fa6614 

UGABios $Id: ugabios.c,u 1.75 2011/10/15 14:07:21 vruppert E 


UBE known Display Interface b0OcO 
UBE known Display Interface bOcS 
UBE Bios $Id: 


ube.c,u 1.64 20117067719 18:25:05 uruppert Exp 


0900018724741i[BIOS ] 


ata0-0: PCHS-1003712717 
IDE time out 

Booting from 0000:7cO0 
，Dx0000900000007co9g in ?? | 


translation=none LCHSz1003712717 


. Ctxt): mou ax, Oxb800 








图 5-13 ”Bochs 执行 到 主 引 导 扇 区 代码 时 的 状态 


当前 等 竺 执行 的 指 邻 是 mov ax,0xb800， 这 就 是 本 音源 
代码 的 第 § 令 ， 该 指令 的 物理 地 址 是 0x0000000000007C00， 指 令 


的 机 顷 el 00 BE 


如 图 5-14 所 示 ， 此 时 ， 可 以 输入 命 
侣 的 内 容 。 


令 "P (Cregister) 来 显示 通用 寄存 





3 Bochs for Windows - Console 而 严 -oh 、 


00001529682i[UVBIOS] UGABios $Id: ugabios.c,u 1.75 2011719715 14:07:21 vruppert EG 
xp $ 
M00015297531[BxXUGA] 
000015297851[BXUGA] 
000015327101i[UBIOS] 
$ 
0001872474i[BIOS ] 
000057496801[BIOS ] 
QQQ1T8249781[BIOS ] 
(0) Breakpoint 1, 
MNext at t=:17825033 
(9] [9x00000000606007c00] 0000:7c906 (Cunk . 





UBE known Display Interface boco 
UBE known Display Interface bQcS 
UBE Bios $Id: ube.c,u 1.64 2011/07/19 18:25:05 uruppert Exp 





atag-0: PCHS:1003/12/17 translation=none LCHS:=1003/12/17 
IDE time out 

Booting from 00860:7cO0 
9x0000000000007cog in ?? | 
CH 这 村: 


mou ax, Oxb800 


: DOx00000000_0000aas55 
410lolololololo olololololor:o 
: DOx000006000_0000ffde 
1: 9x00000000_000e0000 
41ololololololo Mololelolololelo 
: Ox00000000_Q0000000 
| : Ox00000000 00000000 
: OQx0QQ00000 QQ000000 
: DOxb60000000_00007coo 
eflags 0x00000082: id vip vif ac um rf nt IOPLzO of df if tf SF zf af pf cf 
<bochs:5> 


已 了 


rox: 
rbx: 
rbp: 
rdi: 
ra : 
Pit: 
Fi3: 
r15 : 


09x00000000_00090000 
hdilololojolololo 要 ojolsljolslolo 
op Aclolololololo lo oo Loolololole 
9x00000000_00600ffac 
ob delolololololo lo elo Tololololole 
op.aclolololololole melololololololo] 
Ox00000000_00000000 
ob Atlolololololole elololololo Tele 


图 5-14 ”用 “命令 显示 通用 寄存 器 的 内 容 


我 知道 ， 对 于 图 中 的 内 容 ， 你 一 定 会 授 摇 头 表 示 看 不 异 ， 这 其 实 很 

党 。 我 们 此 时 正在 介绍 8086 处 理 器 ， 如 图 5-15 所 示 ， 它 有 8 个 16 位 
的 通用 寄存 器 sAX、BX、CX、DX、SI、DI、BP 和 SP。 其 中 ， 前 4 个 寄 
存 器 还 可 以 各 自分 成 两 个 独立 的 8 位 寄存 器 来 用 ， 即 AH、AL、BH、 
BL、CH、CL、DH 和 DL; 后 4 个 森 存 妖 公 明 


作为 16 位 寄存 厚 整 体 便 
用 。 除 此 之 外 ， 从 图 中 可 以 看 出 ， 它 的 指令 指针 寄存 堪 IP 也 是 16 位 的 。 


3 一 





正如 你 已 经 知道 的 ，8086 已 经 成 为 历史 ， 现 在 我 们 所 使 用 的 处 理 
器 ， 都 是 32 位 或 者 64 位 的 。32 位 x86 处 理 器 对 寄存 器 做 了 扩展 ， 使 之 
达到 32 位 ， 以 处 理 32 位 的 数据 。 如 图 中 所 示 ， 这 8 个 32 位 寄存 器 分 别 
是 EAX、EBX、ECX、EDX、ESI、EDI、EBP 和 ESP， 它 们 可 以 在 程序 
中 直接 做 为 32 位 寄存 器 使 用 。 同 时 ， 指 令 指针 寄存 右 IP 也 做 了 扩展 ， 达 
到 32 位 ， 即 EIP。 为 了 保持 同 8086 的 兼容 性 ， 这 些 寄存 器 的 低 16 位 依 
然 保 持 以 前 的 用 法 ， 这 使 得 以 前 的 程序 可 以 在 32 位 处 理 嚣 上 正常 运行 。 


RAX/RBX/RCX/RDX 
EAX/EBX/ECX/EDX 
AX/BX/CX/DX 
ee sss 
Es 32 31 1 8 7 0 
EE 
/DH DL 
RS/RDI/RBP/RSP/RIP 


ESI/EDI/ESP/EBP/EIP 





此 | 15 O 


后 3 村 六 
后 3 DO 
R8~R15 


图 5-15 ”通用 寄存 强 的 扩展 示意 图 


在 64 位 处 理 器 上 ， 这 些 寄 存 器 再 次 被 扩展 ， 达 到 了 64 位 ， 即 RAX、 
RBX、RCX、RDX、RSI、RDI、RBP、RSP 和 RIP。 同 时 ， 它 们 的 低 32 
位 《包括 低 16 位 ) 依然 保持 从 前 的 用 法 。 

除 此 之 外 ，64 位 的 x86 处 理 器 还 新 增 了 8 个 64 位 的 寄存 器 R8、 
R9、R10、R11、R12、R13、R14 和 R15， 它 们 只 能 整体 作为 64 位 的 寄 
存 右 来 用 。 


屏幕 的 底部 还 显示 了 标志 寄存 器 EFLAGS 的 状态 。 有 关 标 志 寄 存 器 
的 内 容 将 在 后 面 的 章节 里 具体 前 述 ， 这 里 先 不 用 管 它 。 有 关 32 位 处 理 器 
的 内 容 ， 将 在 本 书 的 后 半 部 分 讲解 ， 有 有 有关 64 位 处 理 占 的 内 容 ， 将 在 本 套 
图 书 的 其 他 分 册 讲 解 。 


注意 ， 尽 和 党 Bochs 把 所 有 和 寄存 右 痢 显示 为 64 位 的 宽度 ， 如 RAX， 但 
这 并 不 表明 你 的 处 理 器 就 一 定 是 64 位 的 。 它 的 目的 很 简单 ， 仅 仅 是 希望 
用 同一 种 最 宽 的 格式 来 应 付 所 有 不 同 的 处 理 器 。 
这 样 一 说 你 就 应 该 很 清楚 了 ， 如 前 图 5-14 所 示 ，RAX 的 内 容 是 
0x000000000000aa55， 这 就 意味 着 ，RAX 的 高 48 位 是 全 零 ， 低 16 位 
( 即 AX) 是 0xAA55。 


再 比如 那 幅 图 中 ，RIP 的 内 容 是 0x0000000000007c00， 它 表明 RIP 
寄存 器 的 高 48 位 是 全 零 ， 低 16 位 〈 即 IP) 是 0x7C00。 

我 们 调试 到 哪 一 步 了 ? 

如 图 5-14 所 示 ， 当 前 正在 等 待 执行 指令 是 mov ax,0xb800。 现 在 ， 
我 们 用 “s" 命 令 单 步 执 行 该 指令 。 如 图 5-16 所 示 ， 单 步 执 行 之 后 ， 下 一 条 
等 待 执行 的 指令 是 mov esax， 该 指令 的 物理 内 存 地 址 是 
Ox0000000000007C03。 


因为 刚才 那 条 指令 是 将 立即 数 0xB800 传送 到 寄存 器 AX， 那 么 ， 我 
们 现在 可 以 用 “rr 命令 来 看 看 寄存 器 AX 的 内 容 是 否 真 的 发 生 了 改变 。 如 图 
中 所 示 ， 寄 存 器 AX 的 内 容 是 0xB800， 确 实 符 合 我 们 的 预期 。 


Bochs for Windows - Console 


: Ox00000000_00000080 rbx: OQx00000000_Q0000000 


: QxQ0000000 660060ffde6 rbp: 
1: OxQ0000000 _ 000e0000 rdi: 
40101010101010 0 101010.0101010 r39 : 
4010191010101010 60660000000 r11: 
: 0Ox906000000_6960000000 r13: 
: DOx00000000_06000000 r15: 


QOQxQ0000000 _ 00000000 
QxQ0000000 QO000ffac 
OQx00000000 _ 00000000 
Ob 40lololololololo elololololololo| 


op aololololololo lo oolololo olole 
op Aololololololo lo Lo ololololole 


Lp: Ox00000000_00007c00 
eflags Ox00000082: 1d vip vif 
《bochs:3> s 
Next at t=:17823034 
(0) [0x00000600000007c03] 9090990: 


ac um rf nt IOPL:=0 of df If tf SF zf af pf cf 


[A 


<bochs:6> r 


: Ox00000000_0000b800 rcx: 
: Ox00000000_00000080 rbx: 
: Ox00000000_Q000ffd6 rbp: 
i: OxQQ0000000 QQ0eQ000 rdi: 
: OxQ0000000 00000000 r3 : 
: Ox00000000 _ 00000000 r11: 
: Ox00000000_00000000 r13: 
: 0x00000000_00000000 r15: 
p: Ox00000000_000067c03 
eflags Ox0Q0000082: 1d vip vif 
bochs :7> 


EE 


Ox0Q0000000_00030000 
op aololololololo lo lololololololo 
9x60000006_6006006000 
OxQ0000000 _ 0000ffac 
9xb0000000_0600000060 
Qx00000000 00000000 
Ob Aololololol ol le elolololo leon 
ob aololololololo lo melolololo lololo 


ac um rf nt IOPL:=0 of df If tf SF zf af pf cf 








图 5-16 ”观察 指令 执行 后 的 效 末 《和 寄 仔 苍 AX 的 变化 ) 


接 下 来 ， 继 续 用 单 步 指 令 "s" 来 执行 mov es,ax 指令 。 如 图 5-17 所 
示 ， 该 指令 执行 后 ， 下 一 条 即将 执行 的 指令 是 


mov byte ptr es:0x0,0x4c 


Bochs 的 汇编 指令 格式 和 NASM 相 比 ， 在 某 些 方面 是 不 同 的 。 实 际 
上 ， 这 条 指令 就 是 本 章程 序 中 的 


mov byte [les:0%x00]y DL 


因为 字面 值 上 年 在 程序 编 详 时 了 束 被 转换 成 了 立即 数 0x4c， 所 以 ， 严 
格 地 说 ， 这 条 指令 在 NASM 中 的 格式 是 


mov byte [es:0x0],0Ox4c 


无 论 如 何 ， 这 条 指令 还 没有 执行 ， 刚 才 执 行 的 是 mov es,ax 指令 。 此 
时 ， 段 寄存 器 ES 中 的 内 容 应 当 是 0xB800。 


为 了 验证 这 一 点 ， 应 当 要 求 Bochs 显示 段 寄 存 器 的 内 容 。 为 此 ， 需 
要 使 用 “sreg”(segment register) 命令 。 如 图 中 所 示 ， 当 输入 “sreg” 命 令 
后 ，Bochs 显示 了 一 大 堆 东 西 。 


在 32 位 和 64 位 处 理 器 中 ， 除 了 段 寄 存 器 CS、SS、DS 和 ES 外 ， 还 
新 增 了 两 个 段 寄 存 器 FS 和 GS， 这 一 点 首先 要 明白 。 


然后 ， 在 32 位 和 64 位 处 理 堪 中 ， 以 上 6 个 段 寄 存 堪 都 依然 是 16 位 
的 ， 但 都 额外 增加 了 一 个 不 可 访问 的 部 分 ， 叫 做 段 描述 符 高 速 缓存 器 。 
段 朱 述 符 高 速 缓存 器 由 处 理 需 内 部 使 用 ， 不 能 在 程序 中 访问 ， 里 面 存 放 
了 段 的 起 始 地 址 、 段 的 扩展 范围 ， 以 及 段 和 各 种 属性 ， 比 如 和 它 是 代码 段 
还 是 数据 段 ， 是 否 可 以 写 入 ， 是 否 被 访问 过 ， 等 等 。 这 些 知 识 ， 将 在 本 
书 的 后 半 部 分 评 细 讲解 。 

如 图 中 所 示 ，Bochs 首先 显示 了 上 段 守 存 右 ES 中 的 内 容 ， 是 
0xb800， 这 符合 我 们 的 预期 。 同 时 ， 它 还 显示 了 ES 描述 符 高 速 绥 存 器 
的 内 容 ， 因 为 还 没有 讲 到 ， 所 以 暂时 不 用 管 它 。 


eer 


上 -14 : 0x00000000_000600600 r15: 0x90000000_060000000 
rip: Ox00000000_00007c03 
Id vip vif ac vm rf nt IOPLzO of df If tf SF zf af pf cf 


ef1ags 0x60000082 : 
《bochs:6> S 
Next at t=17825035 
(9) [0x0900600060000007c095] 0000:7c65 (unk.，ctxt)j: mou bute ptr es:0xo0， 
09600664c 
《bochs:7> sreg 
es:9xb800，dh=90x9000939b ，d1:0x8990ffff，uUalidz1 
| Data segnment ，base=0x009b8000，1limitz=0xo9000ffff ， 
cs:0x0000, dh=Qx00009300，dl=0QxQ000ffff,， valid:1 
Data segment, base=-Qx00000000, limit=0QxQQ00fffFF, 
:Ox0000, dh=0Qx00009300, dl=QxQ000fFffFf, valid:=7 
Data segment, base=Qx0Q0000000, limit=0QxQ000ffff, 
:OQx0000, dh=Qx00009300, dl=QxQ000ffff, vallid:1 
Data segment, base=-QxQ0000000, limit=QxQ000fffFF, 
:90x0000，dh=60x006069300 ，d1:0x9900ffff ，ualildz1 
Data segment, base=QxQ0000000, limit:=QxQQQ0FFFF, 
gs:0x0000, dh=0Qx00009300, dl=QxQ000ffff, valid:1 
Data segment ，base-0x90000000，1Limit=9x90090ff 下 f， 
ldtr :Ox00060, dh=Qx00008200,，dl=0Qx0000ffff,， valid:=1 
tr:0x9000，dh=0x000608b090，d1:0x9900ffff，ualldz1 
gdtr :base=<QxQ0000000000fala?, limit=Qx30 
idtr:base=OQx0000000000000000，1imit=0Qx3ff 
<bochs:8> 。 


Readyurite， 
Readyurite， 
Readyurite， 
Read/Write, 
Read/Write, 


Read/UWrite, 





OxHcC : 


Accessed 


Accessed 


Accessed 


Accessed 


Accessed 


Accessed 





PAT 


A 





在 Bochs 中 显示 上 段 寄存 器 的 内 容 


接 下 来 ， 如 图 5-18 所 示 ， 我 们 连续 单 步 执行 两 次 。 对 照 本 章 的 源 程 
序 ， 这 实际 上 是 执行 了 以 下 两 条 指令 : 


图 5-17 


[es 30x001,. "I" 
[es 20x01|, 0x07 


mov byte 


mov byte 


我 们 知道 ， 这 是 在 写 文 本 模式 下 的 显示 绥 冲 区 。 因 此 ， 从 物理 内 存 
地 址 0xB8000 处 开始 的 两 个 字 节 必然 是 0x4C 和 0x07。 





my -2 本 wl 
3 Bochs for Windows - Console en 


Data segment, base=:QxQ0000000, limit:=Qx0O000fFffFF, 
:9x90900，dh=0x00009300，d1:0x09000ffff，uUalld=7 
Data segment ，base:0x900000090，1Limit=9x9909ffff， 
:0x0000, dh=Qx00009300，dl=QxQ000ffff，valid:1 
Data segment, base=-QxOQ0000000, limit:=QxOQ000fFfFFF, 
:Ox0000, dh=Qx00009300,， dl:=QxQQ00ffff, valid:1 
Data segiment, base=:QxQQ0000000, limit=OQxOQ0Q00fFfFFF, 
:Ox0000, dh=Qx00009300，dl:=0QxQ000ffff,，valid:1 
Data segment, base=:OQx00000000, limit:=Qx0O000fFfFFF, 
ldtr :Ox0000, dh=Qx00008200, dl:=:QxQQ0QfFfff, vallid:1 
tr:OQx0000, dh=Qx0Q0008b00, dl=Qx0QQ0QFffFf, valid:1 
gdtr :base=-QxOQ0000000000fala?, limit:=Qx30 
idtr:base=:QxQ000000000000000，1limit:=Qx3ff 
<bochs:8> S 
Next at t:=17825036 


Read/Write,. 
Read/Write, 
Read/Write, 
Read/Write, 


Read/Write. 


Accessed 


Accessed 


Accessed 


Accessed 


Accessed 


(9)j [9x0000000000007cob] 1 


0Q6010007 

《bochs:9> S 

Next at t:17825037 

(90) [9x0900009006000007c11] 60000:7c11 
9096020061 

《bochs:10> xp/2 0xb8009 

[bochs ] : 

OQxOQ0000000000b8000 <bogus+ 


图 5-18 ”显示 内 存 区 域 中 的 内 容 


0Oxob6co7+c 9xob78o9b65 


为 了 验证 这 一 点 ， 需 要 显示 内 存 中 的 内 容 ， 
(eXamine memory at Physical address) ， 即 ， 显 示 指 定 物理 内 存 地 址 


(unk. ctxt): mou byte ptr es:O0x2， 





、 


这 可 以 使 用 命令 “xp” 


处 的 内 容 。xp 命令 每 次 只 显示 一 个 双 字 。 要 显示 多 个 双 字 ， 需 要 用 “六 附 
加 一 个 数量 。 然 后 ， 还 应 当 指 定 一 个 物理 内 存 地 址 。 


如 图 5-18 所 示 ， 在 这 里 ， 我 们 要 求 从 物理 内 存 地 址 0xB8000 开始 ， 
显示 2 个 双 字 。 很 快 ，Bochs 做 出 了 回应 ， 显 示 了 两 个 双 字 0x0b6c074c 
和 0x0b780b65。 


如 图 5-19 所 示 ， 双 字数 据 在 内 存 中 的 存放 是 按 低 闹 字 节 序 的 。 
此 ，0x0b6c074c 这 个 双 字 数据 ， 在 内 存 中 对 应 着 从 物理 地 址 0xB8000 
开始 的 4 个 字 节 0x4C、0x07、0x6C 和 0x0B。 


至 此 ， 基 本 的 程序 调试 技术 束 讲 完了 ， 你 可 以 使 用 “q”(quit) 命令 退 
出 Bochs 调试 过 程 。 


OxO0B6CO74 
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图 5-19 ”以 低 端 字 市 序 分 析 双 和 子 在 内 存 中 的 位 置 


检测 点 5.5 


1. 在 你 自己 的 计算 机 上 重 现 以 上 的 编译 、 运 行 〈( 使 用 VirtualBox) 
和 调试 〈 使 用 bochsdbg) 过 程 。 


2. 单 步 执行 本 章程 序 ， 观 察 div 指令 执行 后 的 寄存 器 内 容 变化 。 


本 章 习 题 
1， 试 找 出 以 下 程序 片断 中 隐藏 的 问题 并 进行 修正 


moOv dX.21015 
meow .BSL LO 
diy Bl 

ng 0xL0 


2. 本 章 的 程序 在 内 存 中 的 加 载 地 址 是 0x0000:0x7C00， 此 时 ， 指 令 
jmp near infi 在 段 内 的 仿 移 地 址 是 多 少 ? 试 修改 本 章 的 源 程序 以 显示 放 
值 。 

3. 汇编 语言 编译 右 玉 用 助 记 从 来 方便 指令 的 书写 和 阅读 。 比 如 ， 
mov 是 传送 指令 ，div 是 除法 指令 。 假 如 Intel 公司 新 推出 一 球 处 理 器 ， 
该 处 理 器 新 增 了 一 条 指令 ， 其 机 器 人 码 为 CD 88。 因 为 是 新 指令 ， 你 的 
NASM 编译 如 肯定 没有 一 个 助 记 符 与 之 相对 应 。 在 这 种 情况 下 ， 如 何在 
你 的 程序 中 使 用 该 指令 ? 


第 6 蔓 ” 相 同 的 功能 ， 不 同 的 代码 


汇编 语言 是 最 有 效率 的 计算 机 语言 ， 由 于 直接 和 面 癌 处 理 器 编程 ， 编 
译 后 的 机 器 代码 执行 起 来 速度 也 是 最 快 的 。 为 了 进一步 讲解 汇编 语言 的 
自 令 和 语法 ， 在 本 章 里 ， 我 们 采用 不 同 的 方法 来 实现 和 上 一 章 相 同 的 功 
能 。 本 草 的 学 习 目 标 征 : 

1.， 用 一 种 不 同 的 分 段 方 法 ， 从 夯 一 个 不 同 的 角度 理解 处 理 豆 的 分 段 
内 存 访 问 机 制 。 

2. 在 计算 机 中 ， 指 令 的 执行 并 非 总 是 按照 它们 的 自然 排列 顺 友 来 进 
行 的 ， 其 执行 流程 也 会 因为 各 种 原因 友 生 变化 。 本 草 将 学 习 两 种 非 顺 序 
的 程序 流程 控制 方法 ， 即 循环 和 条 件 转 移 。 

3. 认识 几 种 新 指令 ， 包 括 movsb、movsw、inc、dec、cld、std、 
div、neg、cbw、cwd、sub、idiv、jcxz、cmp 等 。 


4. 认识 INTEL8086 标志 寄存 器 FLAGS 的 各 个 标志 位 ， 了 解 条 件 转 
移 指 令 。 
5. 认识 计算 机 中 的 负数 。 


6. 学 习 用 Bochs 调试 程序 的 更 多 技巧 ， 包 括 察看 FLAGS 寄存 器 各 
标志 位 的 状态 。 


6.1 ”代码 清单 6-1 





6.2 跳 过 非 指令 的 数据 区 


如 代码 消 早 6-1 所 示 ， 从 产程 序 第 8 行 到 第 10 行 ， 声 明了 非 指 令 的 
数据 。 一 般 来 襄 ， 所 有 人 处理 桌 指 令 部 应 当 顺 序 和 存放 ， 在 它们 中 间 不 允许 
来 来 非 指 令 的 普通 数据 ， 因 为 它们 不 能 作为 指令 执行 。 但 是 ， 如 末 有 兴 
法 让 处 理 右 执行 不 到 这 些 非 指令 的 内 容 ， 则 义 为 当 列 论 。 为 此 ， 在 这 些 
数据 之 前 ， 源 程序 的 第 6 行 ， 是 一 条 转移 指令 


在 这 里 ， 访 指令 用 来 使 处 理 帮 的 执行 流 越过 这 些 不 可 执行 的 数据 ， 
转移 到 后 面 标号 start 处 的 代码 接着 执行 。 


正如 我 们 在 上 一 章 里 讲 到 的 ， 像 jmp near start 这 种 指令 ， 机 器 指令 
的 操作 人 码 是 0xE9， 操 作 数 是 一 个 16 位 的 相对 侦 移 量 ， 这 叫做 相对 近 转 
移 ， 后 面 我 们 还 要 继续 讨论 这 个 话题 。 


6.3 在 数据 声明 中 使 用 字面 值 


在 第 5 章 中 ， 显 示 字 符 串 “Label offset:" 的 方法 是 将 每 个 字符 的 ASCI| 
码 包 侣 在 每 条 指令 中 ， 即 它们 是 作为 每 条 指令 的 操作 数 出 现 的 。 这 种 方 
法 很 原始 ， 也 很 笨拙 。 而 且 ， 如 果 要 改变 显示 的 内 容 ， 则 必须 重新 编写 
指令 ， 很 不 方便 。 

在 本 章 中 ， 我 们 将 要 改变 这 种 做 法 ， 使 得 显示 字符 串 的 手段 更 灵 
活 ， 具 体 做 法 是 专门 定义 一 个 存放 字符 串 的 数据 区 ， 当 要 显示 它们 的 时 
修 ， 再 用 指令 取出 来 ， 一 个 一 个 地 传送 到 显示 绥 冲 区 。 这 样 一 来 ， 负 责 
在 屏幕 上 显示 的 指令 束 和 要 显示 的 内 容 无 关 了 了 。 

源 程序 的 第 8、9 行 ， 这 两 行 的 目的 是 声明 要 显示 的 内 容 。 在 NASM 
里 ，“ 必 是 续 行 符 ， 当 一 行 写 不 下 时 ， 可 以 在 行 尾 使 用 这 个 符号 ， 以 表明 
下 一 行 与 当前 行 应 该 合并 为 一 行 。 

和 上 一 章 相同 ， 在 用 伪 指 令 db 声明 字符 的 ASCIl 码 数 据 时 也 可 以 使 
用 字面 值 。 在 编译 阶段 ， 编 译 器 将 把 、’'a' 等 转换 成 与 它们 等 价 的 ASCII 
代码 。 


除了 ASCl 码 ， 这 里 还 声明 了 每 个 字符 的 显示 属性 值 0x07， 都 是 已 
经 讲 过 的 知识 ， 相 信 很 好 理解 。 


6.4 有 段 地 址 的 初始 化 


汇编 语言 源 程序 的 编译 从 合 一 种 假设 ， 即 编译 后 的 代码 将 从 某 个 内 
存 段 中 ， 偏 移 地 址 为 0 的 地 方 开始 加 载 。 这 样 一 来 ， 如 果 有 一 个 标号 
“abel _a"， 它 在 编译 时 计算 的 汇编 地 址 是 0x05， 那 么 ， 当 程序 被 加 载 到 
内 存 后 ， 它 在 段 内 的 偏 移 地 址 仍然 是 0x05， 任 何 使 用 这 个 标号 来 访问 内 
存 的 指令 都 不 会 产生 问题 。 

但 是 ， 如 条 程序 加 载 时 ， 不 是 从 段 内 偏 移 地 址 为 0 的 地 方 开 始 的 ， 而 
征 0Xx7c00， 那 么 ，label_a 的 实际 偏 移 地 址 就 是 0x7c05。 这 时 ， 所 有 访 
问 label a 的 指令 仍然 会 访问 偏 移 地 址 0x05， 因 为 这 是 在 编译 时 就 决定 了 
的 。 实 际 上 ， 这 样 的 问题 在 上 一 章 束 过 到 过 。 在 那里 ， 因 为 我 们 已 经 知 
道 程序 将 来 的 加 载 位 置 是 0x0000:0x7c00， 所 以 才 有 了 这 样 古 怪 的 写法 : 


mov [Ox/cO0O0+number+0x00] ,dl 


不 得 不 说 ，0x7c00 就 是 理论 和 现实 之 间 的 差距 。 


在 主 引 叶 程 序 中 ， 访 问 内 存 的 指令 很 多 ， 如 果 部 要 加 上 0x7c00 无 疑 
是 很 抹 烦 的 ， 这 个 我 们 已 经 看 到 了 。 其 实 ， 产 生 这 个 问题 的 根源 ， 束 古 
因为 程序 在 加 载 持 ， 没 有 从 段 内 偏 移 地 址 为 0 的 地 方 开始 。 


好 在 Intel 处 理 器 的 分 段 策略 还 是 很 灵活 的 ， 逻 辑 地 址 
0x0000:0x7c00 对 应 的 物理 地 址 是 0x07c00， 该 地 址 又 是 段 0x07C0 的 起 
始 地 址 。 因 此 ， 这 个 物理 地 址 其 实 还 对 应 着 另 一 个 锡 辑 地 址 
0x07c0:0000， 如 图 6-1 所 示 。 


看 到 了 吧 ? 我 们 可 以 把 这 512 字 节 的 区 域 看 成 一 个 单独 的 段 ， 段 的 
基地 址 是 0x07C0， 段 长 512 字 节 。 注 意 ， 该 段 的 最 大 长 度 可 以 为 64KB， 
但 是 在 这 里 ， 我 们 实际 上 仅 使 用 512 个 字 节 。 尽 管 BIOS 将 主 引 导 扇 区 加 
载 到 物理 地 址 0x07c00 处 ， 但 我 们 却 可 以 认为 它 是 从 0x07c0:0x0000 处 
开始 加 载 的 。 


0000: | | 
07C0: 1FF 


SR : 》 2 
0000: 7C00 和 07C0: 0000 


段 : 0000，64KB 





0000: 0000 


图 6-1 以 两 个 逻辑 段 的 视角 看 待 同一 个 内 存 区 域 
在 这 种 情况 下 ， 如 果 执 行 指令 
mo [OxX05|].d1 


那么 ， 处 理 器 将 把 数据 段 寄存 器 DS 的 内 容 (0x07c0) 左 移 4 位 ， 加 上 指 
令 中 指定 的 偏 移 地 址 (0x05) ， 形 成 物理 内 存 地 址 0x07c05， 并 将 寄存 
器 DL 中 的 内 容 传 送 到 该 处。 

所 以 ， 源 程序 第 13、14 行 ， 通 过 传送 指令 将 数据 段 寄存 器 DS 的 内 
容 设置 为 0x07c0。 和 以 前 一 样 ， 源 程序 第 16、17 行 ， 使 附加 有 段 寄存 器 
ES 的 内 容 指 癌 显 示 绥 冲 区 所 在 的 段 0xb800。 


6.5 段 之 间 的 批量 数据 传送 


在 本 半 中 ， 要 在 屏 徐 上 显示 的 内 容 ， 连 同 它 们 的 显示 属性 值 ， 都 集 
中 声明 在 一 起 。 想 显示 它们 ? 那 融 要 将 它们 "所 ”到 0xB800 段 。 有 多 种 方 
法 可 以 做 到 这 一 点 ， 但 8086 处 理 器 提供 了 最 好 的 方法 ， 那 就 是 使 用 
movsb 或 者 movsw 指令 。 

这 两 个 指令 通常 用 于 把 数据 从 内 存 中 的 一 个 地 方 批量 地 传送 〈( 复 
制 〉 到 男 一 个 地 方 ， 处 理 占 把 它们 看 成 是 数据 串 。 但 是 ，movsb 的 传送 
是 以 字 节 为 单位 的 ， 而 movsw 的 传送 是 以 字 为 单位 的 。 

movsb 和 movsw 指令 执行 时 ， 原 始 数 据 串 的 段 地 址 由 DS 指定 ， 偏 
移 地 址 由 SI 指定 ， 人 简写 为 DS:SIl， 妥 传送 到 的 目的 地 址 由 ES:DI 指定 ; 传 
送 的 字 节 数 (movsb) 或 者 字数 (movsw) 由 CX 指定 。 除 此 之 外 ， 还 要 
和 定 是 正 同 传送 还 是 有 反 同 传送 ， 正 同 传 这 是 指 传送 操作 的 方 同 是 从 内 和 丰 
区 域 的 低地 址 六 到 融 地 址 问 ， 反 同 传 送 则 正好 相反 。 正 同 传 送 时 ， 每 传 
送 一 个 字 节 (movsb) 或 者 一 个 字 (movsw) ，SI 和 DI 加 1 或 者 加 2; 
反 向 传送 时 ， 每 传送 一 个 字 节 (movsb) 或 者 一 个 字 (movsw) 时 ，SI 
和 DI 减 去 1 或 者 减 去 2。 不 管 是 正 同 传 送 还 是 反 辐 传送 ， 也 不 管 每 次 传送 
的 是 字 节 还 是 字 ， 每 传送 一 次 ，CX 的 内 容 自动 减 一 。 

如 图 6-2 所 示 ， 在 8086 处 理 嚣 里， 有 一 个 特殊 的 寄存 器 ， 叫 做 标志 
寄存 器 FLAGS。 作 为 一 个 例子 ， 筷 的 第 6 位 是 ZF (Zero Flag) ， 即 零 标 
关 。 当 处 理 严 执行 一 条 算术 或 者 饮 辑 运算 指令 后 ， 算 术 思 辑 部 件 送 出 的 
结 末 除了 送 到 指令 中 指定 位 置 《“ 目 的 操作 数 指定 的 位 置 ) 外 ， 还 送 到 一 
个 或 非 门 。 学 过 馆 辑 电路 谋 程 ， 或 者 看 过 《和 窗 越 计算 机 的 迷雾 》 这 本 书 
的 人 都 知道 ， 或 非 门 的 输入 全 为 0 时 ， 输 出 为 1; 输入 不 全 为 0， 或 者 全 
部 为 1 时， 输出 为 0。 或 非 门 的 输出 送 到 一 个 触发 器 ， 这 了 束 是 标志 寄存 器 
的 ZF 位 。 这 束 是 说 ， 如 果 计 算 结 果 为 0， 这 一 位 被 置 成 1， 表 示 计 算 结 
为 零 是 " 真 " 的 ; 售 则 清除 此 位 (0) 。 

除 此 之 外 ， 它 也 人 允许 通过 指令 设置 一 些 标 六 ， 来 改变 处 理 喜 的 运行 
状态 。 比 如 ， 第 10 位 是 方向 标志 DF (Direction Flag) ， 通 过 将 这 一 位 
清 零 或 者 置 1， 就 能 控制 movsb 和 movsw 的 传送 方向 。 


源 程序 第 19 行 是 方 回 标志 清 零 指令 cld。 这 是 个 无 操作 数 指令 ， 与 其 
相反 的 是 置 方 同 标 志 指 令 std。cld 指令 将 DF 标志 清 零 ， 以 指示 传送 是 正 
方 回 的 。 和 cld 功能 相反 的 是 std 指令 ， 它 将 DF 标志 置 位 (1〉。 此 时 ， 
传送 的 方 回 是 从 融 地 址 到 低地 址 。 


源 程序 第 20 行 ， 设 置 SI 寄存 右 的 内 容 到 源 串 的 站 地 址 ， 也 束 是 标 与 
mytext 处 的 汇编 地 址 。 


源 程序 第 21 行 ， 设 置 目的 地 的 首 地 址 到 DI 寄存 器 。 屏 幕 上 第 一 个 字 
符 的 位 置 对 应 着 0xB800 段 的 开始 处 ， 所 以 设置 DI 的 内 容 为 0。 


第 22 行 ， 设 置 要 批量 传送 的 字 节 数 到 CX 寄存 器 。 因 为 数据 串 是 在 
两 个 标号 number 和 mytext 之 间 声 明 的 ， 而 且 标 号 代表 的 是 汇编 地 址 ， 
所 以 ， 汇 编 语 言 允 许 将 它们 相 减 并 除 以 2 来 得 到 这 个 数值 。 需 要 说 明 的 
是 ， 这 个 计算 过 程 是 在 编译 阶段 进行 的 ， 而 不 是 在 指令 执行 的 时 候 。 除 
以 2 的 原因 是 每 个 要 显示 的 字符 实际 上 占 两 字 节 : ASCI 码 和 属性 ， 而 
movsw 每 次 传送 一 个 字 。 
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图 6-2 ”8086 处 理 絮 的 标志 寄存 强 


第 23 行 ， 是 movsw 指令 ， 操 作 码 是 0xXA5， 访 指令 没有 操作 数 。 使 
用 movsw 而 不 是 movsb 的 原因 是 每 次 需要 传送 一 个 字 (CASCI 码 和 属 
性 ) 。 单 纯 的 movsb 和 movsw 只 能 执行 一 次 ， 如 果 和 希望 处 理 器 上 和 目 动 地 反 


复 执 行 ， 需 要 加 上 指令 前 缀 rep (repeat) ， 意 思 是 CX 不 为 零 则 重复 。 
rep movsw 的 操作 人 码 是 0xF3 0xA5， 它 将 重复 执行 movsw 直到 CX 的 内 
检测 点 6.1 


选择 填空 : MOVSW 指令 每 次 传送 一 个 ) ，MOVSW 指令 每 次 传 
送 一 个 〈 ) 。 原 始 数据 在 段 内 的 俩 移 地 址 在 寄存 规 〈 ) 中 ， 要 传送 的 目 
标 位 置 的 偏 移 地 址 在 寄存 器 ( ) 中 。 如 果 要 连续 传送 多 个 字 或 字 节 ， 则 
需要 ( ) 击 级 ， 在 寄存 占 〈( ) 中 设置 传送 的 次 数 ， 并 设 兽 传 过 的 方 问 。 
其 中 ，《〈 ) 指令 指示 正 同 传 送 ，〈 ) 指令 指示 反 同 传送 。 反 回 传送 时 ， 
每 传送 一 次 ，S| 和 DI 的 内 容 将 ( ) 。 


A. 字 广 B. 字 C.di D.si E.cx Frep G. 减 小 H.std lcld J. 
增 大 


6.6 ”使 用 循环 分 解数 位 


为 了 显示 标号 number 所 代表 的 汇编 地 址 ， 源 程序 第 26 行 用 于 将 它 
的 数值 传送 到 寄存 器 AX， 这 个 和 以 前 是 一 样 的 。 

声明 标号 number 并 从 此 处 开始 初始 化 5 字 节 的 目的 主要 是 保存 数 
位 ， 但 同时 我 们 还 想 显 示 它 的 汇编 地 址 。 为 了 访问 标号 number 处 的 数 
位 ， 需 要 获取 和 它 在 内 存 段 中 的 仿 移 地 址 。 

为 此 ， 源 程序 第 29 行 ， 通 过 将 AX 的 内 容 传送 到 BX， 来 使 BX 指向 
该 处 的 偏 移 地 址 。 实 际 上 ， 这 等 效 于 


mov bx,number 


只 不 过 用 寡人 存货 传 递 来 得 更 忆 ， 更 方便 。 

第 29 一 37 行 依 旧 做 的 是 分 解数 位 的 事 ， 但 用 了 和 以 往 不 同 的 方法 。 
简单 地 说 ， 惑 是 循环 。 循 环 依靠 的 是 循环 指令 foop， 访 指令 出 现在 源 程 
序 的 第 37 行 : 


LoD Lglt 


loop 指令 的 功能 是 重复 执行 一 段 相 同 的 代码 ， 处 理 带 在 执行 它 的 时 
候 会 顺序 做 两 件 事 : 


将 寄存 器 Cx 的 内 容 减 一 ; 
如 果 cx 的 内 容 不 为 零 ， 转 移 到 指定 的 位 置 外 执行， 否则 顺序 执行 后 面 的 指令 。 


和 源 程 序 第 6 行 的 jmp near start 一 样 ，loop digit 指令 也 是 颇具 迷惑 
性 的 指令 ， 它 的 机 器 指令 操作 码 是 0xE2， 后 面 跟着 一 个 字 节 的 操作 数 ， 
而 且 也 是 相对 于 标号 处 的 仿 移 量 ， 是 在 编译 阶段 ， 编 译 占 用 标号 digit 所 
在 位 置 的 汇编 地 址 减 去 loop 指令 的 汇编 地 址 ， 再 减 去 loop 指令 的 长 虔 
(2) 来 得 到 的 。 

为 了 使 loop 指令 能 正常 工作 ， 需 要 一 些 准 备 。 源 程序 第 30 行 ， 将 循 
环 次 数 传 送 到 CX 寄存 器 。 因 为 分 解 AX 中 的 数 需 要 循环 5 次 ， 故 传送 的 
值 是 5。 


产程 序 第 31 行 ， 将 除数 10 传送 到 寄存 此 Sl。 

源 程序 第 33 一 37 行 是 循环 体 ， 每 次 循环 都 会 执行 这 些 代 人 码 ， 主 要 是 
做 除法 并 保存 每 砍 得 到 的 余数 。 每 次 际 法 之 前 部 要 先 将 DX 清 零 以 得 到 被 
除数 的 高 16 位 ， 这 是 源 程 序 第 33 行 所 做 的 事情 。 

做 完 际 法 之 后 ， 第 35 行 ， 将 DL 中 得 到 有 的 余数 传 运 到 由 BX 所 指示 的 
由 存单 元 中 去 。 这 是 我 们 第 一 次 接触 到 人 般 移 地 址 来 目 于 寄存 夫 的 情况 ， 
而 在 此 之 前 ， 我 们 仅仅 是 使 用 类 似 于 下 面 的 指令 : 


iow [UXO0S]. Ql 
mov [number],al 


mo [numBerte0x02|;c1 


尺 官 方式 人 不同 ， 但 mov [bx],dl 做 相同 的 事 迟 ， 那 束 古 把 DL 中 的 内 
容 ， 传 送 到 以 DS 的 内 容 为 段 地 址 ， 以 BX 的 内 容 为 偏 移 地 址 的 内 存单 元 
中 去 。 注 意 ， 指 令 中 的 中 括号 是 必 和 十 的， 任 则 束 古 传 庆 到 BX 中 ， 而 不 是 
BX 的 内 容 所 指示 的 内 存单 元 了 。 


在 8086 处 理 器 上， 如 果 要 用 寄存 占 来 提供 偏 移 地 址 ， 只 能 使 用 BX、 
SI、DI、BP， 不 能 使 用 其 他 寄存 硕 。 所 以 ， 以 下 指令 都 是 非法 的 : 


mov [Laxlsydl 


mov [dx|. bx 


原因 很 简单 ， 寄 存 右 BX 最 人 切 的 功能 之 一 束 是 用 来 提供 数据 访问 的 基 
地 址 ， 所 以 又 叫 基 址 寄存 器 (Base Address Register) 。 之 所 以 不 能 
SP、IP、AX、CX、DX， 这 是 一 种 硬性 规定 ， 说 不 上 有 什么 特别 的 理 
由 。 而 且 ， 在 设计 8086 处 理 旨 时， 每 个 宫 存 鼎 部 有 目 己 的 特殊 用 途 ， 比 
如 AX 是 累加 器 (Accumulator) ， 与 它 有 关 的 指令 还 会 做 指令 长 度 上 的 
优化 〈 较 短 ) ; CX 是 计数 器 (Counter) ; DX 是 数据 (Data) 寄存 
器 ， 除 了 作为 通用 寄存 器 使 用 外 ， 还 专门 用 于 和 外 设 之 间 进 行 数 据 传 
送 ; SI 是 源 索 引 寄 存 器 (Source Index) ; DI 是 目标 索引 寄存 器 
( Destination Index) ， 用 于 数据 传 迹 操作 ， 我 们 已 经 在 movsb 和 
movsw 指令 的 用 法 中 领略 过 了 。 

注意 ， 可 以 在 任何 市 有 内 存 操 作 数 的 指令 中 使 用 BX、SI 或 者 DI 提供 
偏 移 地 址 。 


做 完 一 次 除法 ， 并 保存 了 数位 之 后 ， 源 程序 第 36 行 ， 用 于 将 BX 中 
的 内 容 加 一 ， 以 指 癌 下 一 个 内 存单 元 。inc 是 加 一 指令 ， 操 作 数 可 以 是 8 
位 或 者 16 位 的 寄存 右 ， 也 可 以 是 字 节 或 者 字 内 存单 元 。 从 功能 上 讲 ， 它 
和 


旦 一 样 的 ， 但 前 着 的 机 硕 码 更 短 ， 速 度 更 快 。 下 面 是 两 个 例子 : 


Tre al 
ine vibe [Dx]| 


Tne word [label a 


以 上 ， 第 一 条 指令 执行 时 ， 处 理 器 将 寄存 器 AL 中 的 内 容 加 一 ， 第 二 
条 指令 执行 时 ， 将 寄存 器 BX 所 指向 的 内 存单 元 的 内 容 加 一 。 就 是 说 ， 处 
理 器 用 段 寄存 器 DS 的 内 容 左 移 4 位 ， 加 上 寄存 器 BX 的 内 容 ， 形 成 20 位 
物理 地 址 。 然 后 ， 将 该 地 址 处 的 内 容 〈 字 节 ) 加 一 。 

第 三 条 指令 做 和 第 二 条 指令 相同 的 事情 ， 但 是 偏 移 地 址 是 用 标号 给 
出 的 。 关 键 字 “word" 表 明 它 操作 的 是 内 存 中 的 一 个 字 ， 段 地 址 在 段 寄存 器 
DS 中 ， 偏 移 地 址 等 于 标号 label_a 在 编译 阶段 的 汇编 地 址 。 

和 inc 指令 相对 的 是 dec 指令 ， 用 于 将 目标 操作 数 的 内 容 减 一 ， 它 们 
的 指令 格式 相同 ， 不 再 效 述 ， 

源 程序 第 37 行 ， 正 是 loop 指令 。 就 像 我 们 刚才 说 的 ， 它 将 CX 的 内 
容 减 一 ， 并 判断 是 否 为 零 。 如 果 不 为 零 ， 则 跳 转 到 标号 digit 所 在 的 位 置 
处 执行 。 

很 显然 ， 在 指令 的 地 址 部 分 使 用 寄存 器 ， 而 不 是 数值 或 者 标号 〈 其 
实 标号 是 数值 的 等 价 形式 ， 在 编译 后 也 是 数值 ) 有 一 个 明显 的 好 处 ， 那 
就 是 可 以 在 循环 体 里 方便 地 改变 偏 移 地 址 ， 如 果 使 用 数值 就 不 能 做 到 这 


检测 点 6.2 
选择 题 : 下 面 哪些 指令 是 错误 的 ， 为 什么 ? 


A.add ax,|bx| B.mov ax,|SI C.mov ax,|[CcxX] 
D.mov dx,[diI] 


E.mov dx,[ax]| F.Inc byte [di] G.div word [bx] 


6.7 计算 机 中 的 负数 


6.7.1 无 符号 数 和 有 符号 数 
为 了 讲解 后 面 的 内 容 时 能 够 顺利 一 些 ， 现 在 我 们 离开 源 程序 ， 来 介 


绍 一 些 题 外 的 知识 。 

从 本 书 的 开 遍 到 现在 ， 我 们 一 直 没 有 提 到 负数 ， 就 好 像 世 界 上 根本 
没有 负数 一 样 。 计 算 机 当然 要 处 理 负 数 ， 要 不 然 它 将 没有 多 少 实 用 价 
(全 < 

在 计算 机 中 使 用 负数 ， 这 是 一 个 容易 令 人 产生 迷惑 的 话题 。 不 信 ? 
现在 就 开始 了 了 。 

尽管 我 们 从 来 没有 考虑 过 数 的 正 负 问题 ， 但 是 ， 事 实 上， 我 们 在 编 
写 程 序 的 时 候 ， 既 可 以 使 用 正 数 ， 也 可 以 使 用 负数 。 如 图 6-3 所 示 ， 我 们 
在 程序 中 用 伪 指 令 db 声明 了 一 些 正 数 和 一 些 负数 。 


8 Asm Editor-2011-11 [E:\MA32ASM\booktool\exam.asm] 
文件 (F) 选项 (D) 说 明 (H) 
1 


2 db 128,127,3,2,1,0,-1,-2,-3,-127,-12 








图 6-3 在 汇编 源 程序 中 使 用 负数 的 例子 


图 6-4 显示 了 编译 后 的 结果 。 用 伪 指 令 db 声明 的 数据 都 只 有 一 个 字 
节 的 长 度 ， 所 以 很 容易 在 这 两 幅 图 的 各 个 数 之 间 建 立 对 应 关系 ， 





$43 HexViewer-2011-11 [E:\IA32ASM\booktool\exam.bin] 
| 文件 (P) 
00000000 80 7F 
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图 6-4” 正 数 和 人 负数 编译 后 的 结 


前 面 的 正 数 都 很 好 理解 ,十进制 数 128 对 应 的 二 进 制 数 是 
10000000， 对 应 的 十 六 进 制 数 是 0x80;， 十进制 数 0 对 应 的 二 进 制 数 是 
00000000， 对 应 的 十 六 进 制 数 是 0x00。 为 什么 我 们 对 此 不 感到 新 鲜 ? 
为 这 显得 非常 目 然 ， 从 本 书 一 开始 到 现在 ， 我 们 束 是 这 样 工 作 的 。 

真正 的 麻烦 在 于 后 面 的 负数 ， 比 如 一 1， 它 在 编译 的 时 候 ， 编 译 器 会 
怎么 做 呢 ? 

它 很 守 ， 但 也 很 聪明 。 因 为 一 1 其 实 等 于 0 一 1， 它 就 知道 可 以 做 一 
次 减法 。 当 然 ， 这 个 减法 ， 不 是 你 已 经 熟悉 的 十 进 制 减法 ， 这 没有 用 ， 
你 得 做 二 进 制 的 减法 ， 也 就 是 用 二 进 制 数 0 减 去 二 进 制 数 1， 结 果 是 


er dd de td ed del: 


注意 左边 的 管 略 写 ， 这 十 因为 在 相 减 的 过 程 中 ， 不 停 地 问 左边 信 位 
的 结 东 。 因 此 ， 可 以 说 ， 这 个 数字 是 很 长 的 ， 取 次 于 你 什么 时 候 俘 止 信 
位 。 

再 比如 十 进 制 数 一 2， 可 以 用 0 一 2 来 得 到 ， 在 二 进 制 的 世界 里 ， 该 
减法 十 二 进 制 数 0 减 去 二 进 制 数 10， 结 条 征 


om a 
同样 ， 相 减 的 过 程 要 问 左 全 位 ， 所 以 这 个 数字 相当 长 。 但 是 ， 最 厂 
边 那 一 位 是 0。 


在 计算 机 中 ， 数 字 保 存在 寄存 左 里 ， 而 在 16 位 处 理 左 里 ， 和 寄存 谷 通 
利和 是 8 位 和 16 位 的 。 因 此 ， 以 上 祖 减 的 结束 ， 只 能 保留 最 右边 的 8 位 或 


者 16 位 。 举 个 例子 ， 十 进 制 数 一 1 在 寄存 器 AL 中 的 二 进 制 形 式 是 
Ti 
BROxFF; 十 进 制 数 一 2 在 寄存 项 AL 中 的 二 进 制 形 却 十 


二 


即 0xFE。 如 朱 是 16 位 的 寄存 规 ， 则 相应 地 ， 要 保留 相 减 结 末 的 最 石 边 16 
位 。 因 此 ， 十 进 制 数 -1 在 AX 寄存 器 中 的 二 进 制 形 式 是 


a 
BOxFFFF; 十 进 制 数 一 2 在 寄存 磺 AX 中 的 二 进 制 形式 是 
a i 


即 OxFFFE。 


当然 ， 数 据 还 可 以 保存 在 内 存 中 ， 或 者 编 详 后 的 二 进 制 文件 中 。 在 
二 进 制 文件 中 ， 数 据 是 用 伪 指 令 db 或 者 dw 等 定义 的 。 但 是 ， 数 据 的 表 


4 


datad db -1 ; 初始 化 为 0xXFF 
datal db -2 ; 初始 化 为 0xFE 
data2 dw =1 ;初始 化 为 0xXFFFF 
data3 dw -2 ; 初始 化 为 0xXFFFE 


这 是 很 令 人 吃惊 的 。 因 为 我 们 知道 ，0xFF 等 于 十 进 制 数 255， 但 现 
在 它 又 是 十 进 制 数 一 1， 哪 一 个 才 是 正确 的 呢 ? 我 们 应 该 以 哪 一 个 为 准 
呢 ? 

好 吧 ， 假 设 这 人 揭 强 能 接受 的 话 ， 那 么 ， 对 照 一 下 图 6-3 和 网 6-4， 你 
会 发 现 ，0x80 既是 十 进 制 数 128， 又 是 十 进 制 数 一 128， 到 底 哪 一 个 是 正 
硝 的 呢 ? 

这 真是 令 人 头疼 的 问题 ， 不 单单 是 对 我 们 ， 对 几 十 年 前 那些 计算 机 
工程 师 们 来 说 也 是 如 此 。 


一 个 民 好 的 解决 方案 是 ， 将 计算 机 中 的 数 分 成 两 大 类 : 无 符号 数 和 
有 符号 数 。 无 符号 数 的 意思 是 我 们 不 关心 这 些 数 的 从 号 ， 因 此 也 束 无 所 
谓 正 负 ， 反 正 它 们 就是 数 而 已 ， 就 像 小 学 生 一 样 ， 眼 中 只 有 目 然 数 。 在 8 
位 的 字 节 运算 中 ， 无 符号 数 的 范围 是 00000000 一 11111111， 即 十 进 制 的 
0 一 255; 在 16 位 的 字 运 算 中 ， 无 符号 数 的 范围 是 0000000000000000 一 
1111111111111111， 即 十 进 制 的 0 一 65535; 在 将 来 要 讲 到 的 32 位 运算 
中 ， 无 从 本 数 的 天 是 000000000000000000000000 一 
11111111111111111111111111111111， 即 十 进 制 的 0 一 4294967295。 很 显 
然 ， 我 们 以 前 使 用 的 一 直 是 无 从 写 数 。 


相反 地 ， 有 符 亏 数 是 分 正 、 负 的 ， 而 有 规定 ， 数 的 正 负 要 通过 它 的 
最 高 位 来 辨别 。 如 果 最 高 位 是 0(， 它 就 是 正 数 ;如 果 是 1， 就 是 负数 。 如 
此 一 来 ， 在 8 位 的 字 节 运算 环境 中 ， 正 数 的 范围 是 00000000 一 
01111111， 即 十 进 制 的 0 一 127; 负数 的 范围 是 10000000 一 11111111， 即 
十 进 制 的 一 128 一 一 1。 

下 的 有 符 写 数 ， 和 与 它 同 值 的 无 从 号 数 相同 ， 这 没什么 好 说 的 ， 毕 
葛 它 们 形式 上 相同 ， 按 相同 的 方式 处 理 最 为 方便 。 但是， 负数 就 不 同 
了 ， 在 这 里 ，10000000 一 11111111 这 些 负 数 ， 都 是 用 0 减 去 它们 相对 应 
的 正 数 得 到 的 。 想 知道 它们 各 目 对 应 的 正 数 是 谁 吗 ? 很 简单 ， 因 为 "负数 
的 负数 "是 正 数 ， 所 以 只 需要 用 0 减 去 这 个 负数 束 行 。 所以， 你 可 以 试 试 


00000000 一 10000000= 二 10000000 (和 十进制 数 128) 
00000000 一 11111111= 二 00000001 《十进制 数 1) 


所 以 ，10000000 一 11111111 这 个 沙 围 内 的 有 符号 数 ， 对 应 着 十 进 制 
数 一 128 一 一 1。 
顺便 说 一 下 ， 在 8086 处 理 器 中 ， 有 一 条 指令 专门 做 这 件 事 ， 它 就 是 
neg。neg 指令 带 有 一 个 操作 数 ， 可 以 是 8 位 或 者 16 位 的 寄存 器 ， 或 者 内 
存单 元 。 如 
neg al 


neg dx 


ned word Liabey al 


它 的 蕊 能 很 商 单 ， 用 0 减 去 指令 中 指定 的 操作 数 。 例 子 : 如 果 AL 中 
的 内 容 是 00001000 十进制 数 8) ， 执 行 neg al 后 ，AL 中 的 内 容 变 为 
11111000 (十 进 制 数 一 8) ; 如 果 AL 中 的 内 容 为 11000100 (十 进 制 数 一 
60) ， 执 行 neg al 后 ，AL 中 的 内 容 为 00111100 十进制 数 60〉。 

相应 地 ， 在 16 位 的 字 运 算 环 境 中 ， 正 数 的 范围 是 
0000000000000000 一 0111111111111111 ， 即 十 进 制 的 0 一 32767， 负 数 
的 范围 是 1000000000000000 一 1111111111111111， 即 十 进 制 的 一 32768 
一 一 1。 

不 要 给 计算 机 和 编译 器 添 肪 烦 。 既 然 你 已 经 知道 一 个 字 节 可 以 容纳 
的 数据 范围 是 十 进 制 的 一 128 一 127， 就 不 要 这 样 写 : 


和 DO eu 20UU 


寄存 器 AL 只 有 8 位 ， 因 此 ， 编 译 后 ， 一 200 将 被 截断 ， 机 器 码 为 BO 
38。 你 可 以 这 样 写 : 


IO ax, 200 


这 时 ， 编 详 后 的 机 带 公 为 B8 38 FF。 
同样 的 规则 也 适用 于 伪 指 令 db 和 dw。 举 例 〈 以 下 均 为 十 进 制 数 ) : 


db 255 ;正确 ， 可 以 看 成 声明 无 符号 数 

db -125 正确， 数据 未 超 范 转 

db -240 ;错误 ， 超 过 字 节 所 能 容纳 的 数据 范围 ， 会 被 截断 
dw -240 ;正确 ， 数 据 未 超 范 转 

dw -30001 正确， 数据 未 超 范 围 


32 位 有 人 符号 数 是 16 位 和 8 位 有 符 亏 数 的 超 集 ，16 位 有 人 符 写 数 义 是 8 
位 有 符号 数 的 超 集 ， 它 们 互相 之 间 有 重 登 的 部 分 。 正 数 还 好 说 ， 十 进 制 
数 15， 在 8 位 运算 环境 中 是 00001111， 在 16 位 运算 环境 中 是 
0000000000001111， 没 有 什么 区 别 。 但 是 ， 同 一 个 负数 ， 其 表现 形式 略 
有 差别 。 比 如 十 进 制 数 一 3， 它 在 8 位 运算 中 是 11111101， 即 0xFD; 在 
16 位 运算 中 ， 则 是 1111111111111101， 即 0xFFFD 。 这 种 差别 的 来 源 很 
简单 ， 我 们 已 经 讲 过 了 ， 在 计算 机 中 ， 一 3 是 用 0 减 去 3 得 到 的 ， 在 8 位 
运算 中 只 能 保留 结果 的 低 8 位 ， 即 11111101 (CO0xFD) ; 在 16 位 运算 中 只 
能 保留 结果 的 低 16 位 ， 即 1111111111111101 (COxFFFD ) 。 


很 显然 ， 一 个 8 位 的 有 符号 数 ， 要 想 用 16 位 的 形式 来 表示 ， 只 需 将 
其 最 高 位 ， 也 就 是 用 来 辨别 符号 的 那 一 位 《几乎 所 有 的 书 上 都 称 之 为 符 
号 位 ， 实 际 上 这 并 不 严谨 ) ， 扩 展 到 高 8 位 即 可 。 为 了 方便 ， 处 理 占 专门 
设计 了 两 条 指令 来 做 这 件 事 : cbw (Convert Byte to Word ) 和 
cwd (Convert Word to Double-word) 。 


cbw 没有 操作 数 ， 操 作 码 为 98。 它 的 功能 是 ， 将 寄存 器 AL 中 的 有 符 
号 数 扩 展 到 整个 AX。 举 个 例子 ， 如 果 AL 中 的 内 容 为 01001111， 那 么 执 
行 该 指令 后 ，AX 中 的 内 容 为 0000000001001111， 如 果 AL 中 的 内 容 为 
10001101， 执 行 该 指令 后 ，AX 中 的 内 容 为 1111111110001101。 


cwd 也 没有 操作 数 ， 操 作 码 为 99。 它 的 功能 是 ， 将 寄存 器 AX 中 的 有 
从 号 数 扩 展 到 DX:AX 。 举 个 例子 ， 如 果 AX 中 的 内 容 为 
0100111101111001 ， 那么 执行 该 指令 后 ，DX 中 的 内 容 为 
0000000000000000 ，AX 中 的 内 容 不 变 ; 如 果 AX 中 的 内 容 为 
1000110110001011 ， 那么 执行 该 指令 后 ，DX 中 的 内 容 为 
1111111111111111，AX 中 的 内 容 同 样 不 变 。 

尺 害 有 符号 数 的 最 珊 位 通常 称 为 全 写 位 ， 但 并 不 意味 看 它 仪 仪 用 来 
表示 正 负 号 。 事 实 上， 通过 上 面 的 讲述 和 实例 可 以 看 出 ， 它 既是 数 的 一 
部 分 ， 和 其 他 比特 一 起 共同 表示 数 的 大 小 ， 同 时 又 用 来 判断 数 的 正 负 。 


6.7.2 处理 器 视角 中 的 数据 类 型 


无 从 号 数 和 有 符号 数 的 划分 并 没有 从 根本 上 打消 我 们 的 疑虑 ， 即 假 
如 寄存 器 AX 中 的 内 容 是 0xB23C， 那 么 ， 它 到 底 是 无 符号 数 45628 呢 ， 
还 是 应 当 将 其 看 成 是 一 19908? 

答案 是 ， 这 是 你 目 己 的 事 ， 取 决 于 你 怎么 看 得 它 。 对 于 处 理 器 的 多 
数 指令 来 说 ， 执 行 的 结果 和 操作 数 的 类 型 没有 关系 。 换 句 话 说 ， 无 论 你 
是 从 无 从 号 数 的 角度 来 看 ， 还 是 从 有 符号 数 的 角度 来 看 ， 指 令 的 执行 结 
果 都 是 正确 无 误 的 。 比 如 


mov ah,al 
这 条 指令 显然 根本 不 考虑 操作 数 的 类 型 。 再 比如 


mo ah 0xtg 


ea 


在 这 里 ，0xf0 的 二 进 制 形式 是 11110000， 它 既 可 以 解释 为 无 符号 数 
240〈 十 进 制 ) ， 也 可 以 解释 为 有 符号 数 一 16， 毕 竟 它 的 符号 位 是 1。 无 
论 如 何 ，inc 是 加 一 指令 ， 这 条 指令 执行 后 ，AH 中 的 内 容 是 二 进 制 数 
11110001， 既 是 无 符号 数 241， 也 是 有 符号 数 一 15。 

再 考虑 加 法 和 运算。 比如 


mov ax 0x8c03 


add ax, Ox0D5 


0x8c03 的 二 进 制 形式 是 1000110000000011， 既 可 以 看 做 无 符号 数 
35843【〔 十 进 制 ) ， 也 可 以 看 成 是 有 符 写 数 一 29693 十进制 ) 。 在 运算 
过 程 中 ， 数 的 视角 要 统一 ， 如 果 把 0x8c03 看 成 是 无 符号 数 ， 那 么 0x05 
也 是 无 符号 数 ， 如 果 0x8c03 是 有 符号 数 ， 那 么 0x05 也 是 有 符号 数 。 

天 键 是 运算 后 的 结果 。 人 很 六 运 的 是 ，add 指令 同样 适用 于 无 符号 数 
和 有 符号 数 。 所 以 ， 这 两 条 指令 执行 后 ，AX 中 的 内 容 是 0x8c08， 分 别 可 
以 看 成 是 无 符号 数 35848 和 有 符号 数 一 29688。 

再 来 考虑 一 下 减法 。 考 虑 一 下 ， 如 果 要 计算 10 一 3， 这 其 实 可 以 看 成 
是 10 十 (一 3) 。 因 此 ， 使 用 以 下 三 条 指令 就 可 以 完成 减法 运算 : 


movy ah;,10 
MOY DL 3 


add ah,al 


正 是 因为 这 个 原因 ， 很 多 处 理 器 内 部 不 构造 减法 电路 ， 而 是 使 用 加 
法 电路 来 做 减法 。 

尽管 如 此 ， 为 了 方便 起 见 ， 处 理 器 还 是 提供 了 减法 指令 sub， 该 指令 
和 加 法 指令 add 相似 ， 目 的 操作 数 可 以 是 8 位 或 者 16 位 通用 寄存 器 ， 也 
可 以 是 8 位 或 者 16 位 的 内 存单 元 ， 源 操作 数 可 以 是 通用 寄存 器 ， 也 可 以 
是 内 存单 元 或 者 立即 数 〈 不 允许 两 个 操作 数 同 时 为 内 存单 元 ) 。 比 如 


sub ah,al 
SU dx, ax 


Sup | Lanel alehn 


因为 处 理 禹 没有 减法 运 拭 电路 ， 所 以 ， 举 例 来 说 ，sub ah,al 指令 实 
际 上 等 效 于 下 面 两 条 指令 : 


neg al 


add an， al 


可 以 这 么 说 ， 几 乎 所 有 的 处 理 器 指令 既 能 操作 无 符号 数 ， 又 能 操作 
有 符号 数 。 但 是 ， 有 几 条 指令 除外 ， 比 如 除法 指令 和 乘法 指令 。 

我 们 已 经 学 过 除法 指令 div。 严 格 地 说 ， 它 应 该 叫做 无 符号 除法 指令 
(Unsigned Divide) ， 因 为 这 条 指令 只 能 工作 于 无 符号 数 。 换 句 话 说 ， 
只 有 从 无 符号 数 的 角度 来 解释 它 的 执行 结果 才能 说 得 通 。 举 个 例子 : 


moOV ax,0O0x0400 
mov BLE 
diy Bl ;执行 后 ，AL 中 的 内 容 为 0x04， 即 十 进 制 数 4 


从 无 符号 数 的 角度 来 看 ，0x0400 等 于 十 进 制 数 1024，0xf0 等 于 十 
进 制 数 240。 相 除 后 ， 寄 存世 AL 中 的 商 为 0x04， 即 十 进 制 数 4， 完 全 下 
确 。 


但 是 ， 从 有 符号 数 的 角度 来 看 ，0x0400 等 于 十 进 制 数 1024，0xf0 
等 于 十 进 制 数 一 16。 理 论 上 ， 相 除 后 ， 寄 存 需 AL 中 结果 应 当 是 0xc0。 
其 最 高 位 是 “1”， 故 为 负数 ， 即 十 进 制 数 为 一 64。 

为 了 解决 这 个 问题 ， 处 理 占 专门 提供 了 一 个 有 符 写 数 除法 指令 
idiv (Signed Divide ) 。idiv 的 指令 格式 和 div 相同 ， 除 了 它 是 专门 用 于 
计算 有 符号 数 的 。 如 果 你 决定 要 进行 有 符号 数 的 计算 ， 必 须 采 用 如 下 代 
伺 : 


mov ax,0O0x0400 
meow BL QE 
idiy Bl ;执行 后 ，AL 中 的 内 容 为 0xc0， 即 十 进 制 数 一 64 


在 用 idiv 指令 做 除法 时 ， 需 要 小 心 。 比 如 用 0xf0c0 除 以 0x10， 也 就 
是 十 进 制 数 的 除法 一 3904+ 16。 你 的 做 法 可 能 会 是 这 样 的 : 


mo ax;0O0xf0c0 
mov bi 90x10 
AL DLL 


以 上 的 代码 是 16 位 三 进 制 数 除法 ， 结 末 在 寄存 如 AL 中 。 除 法 的 结 
琳 应 当 十 十 进 制 数 一 244， 冰 憾 的 是 ， 这 样 的 结果 超出 了 寄存 右 AL 所 能 


表示 的 范围 ， 必 然 因 为 光 出 而 不 正确 。 为 此 ， 你 可 能 会 用 32 位 的 除法 来 
代 葵 以 前 的 做 法 : 


xor dx,dx ;如 此 一 来 ，DX: AX 中 的 数 成 了 正 数 
moOv ax. DxtOeo 
mov bx OxLo 


LT BL 


很 站 憾 ， 这 依然 古 错 的 。 十 进 制 数 一 3904 的 16 位 二 进 制 形式 和 32 
位 二 进 制 形式 是 不 同 的 。 前 者 是 0xf0c0， 后 者 是 0xfffff0c0。 还 记得 cwd 
吗 ? 你 应 该 用 这 条 指令 把 寄存 器 AX 中 数 的 符号 扩展 到 DX。 上 所 以 ， 完 全 
正确 的 与 法 站 这 样 的 : 
mov 入 OxfO0c0 
cwd 


mo Bx, Ox10 


1d1™ 4 
以 上 指令 全 部 执行 后 ， 寄 存 右 AX 中 的 内 容 为 0xffoc， 即 十 进 制 数 一 
244 。 


主动 权 在 你 目 己 手 上 ， 在 与 程序 的 时 候 ， 你 要 做 什么 ， 什 么 目的 ， 
你 目 己 最 痛楚 。 如 琳 是 无 从 写 数 计 算 ， 必 须 使 用 div 指令 ;， 如 条 你 是 在 做 
有 人 符 写 数 计算 ， 束 应 当 使 用 idiv 指令 。 

检测 后 6.3 


假如 以 下 声明 的 是 有 和 从 写 数 ， 那么 ， 其 中 的 负数 是 
( J 


data0 db Oxf0,0x05,0x66,0xff,Ox81 
data1 dw Oxfff,Oxffff, 0x8b,0x8a08 


6.8 数位 的 显示 


一 旦 各 个 数位 部 分 解 出 来 了 了 ， 下 面 的 工作 束 古 在 屏 硕 上 显示 它们 。 
源 程 序 第 40 行 ， 将 保存 有 各 个 数位 的 数据 区 首 地 址 传送 到 基 址 寄存 器 
BX。 


一 共有 5 个 数字 要 显示 ， 它 们 在 当前 数据 段 内 的 起 始 偏 移 地 址 束 是 
number 的 汇编 地 址 ， 且 已 传送 到 寄存 器 BX 中 。 为 了 依次 得 到 这 5 个 数 
字 ， 程 序 中 使 用 的 指令 是 


NOY al [Bts1| 


在 这 里 ， 我 们 的 意图 是 ， 寄 存 器 BX 中 的 内 容 是 其 地址， 保持 不 变 ， 
当 寄 存 器 SI 的 内 容 从 0 逐次 增加 到 4， 或 者 反 过 来 ， 从 4 递减 到 0 时 ， 就 
可 以 通过 BX+SI 来 连续 访问 这 5 个 数字 。 在 这 里 ，SI 的 作用 相当 于 过 
引 ， 因 此 它 被 称 为 索引 寄存 器 (Index Register) ， 或 者 叫 变 址 寄存 器 。 
另 一 个 党 用 的 变 址 寄存 器 是 DI。 

注 章 ，INTEL8086 处 理 右 只 人 允许 以 下 几 种 基 址 寄存 右 和 变 址 寄存 鼎 
的 组 合 : 


这 些 组 合 可 以 用 于 任何 市 有 内 存 操作 数 的 指令 中 。 其 他 任何 组 合 ， 
比如 [bx+ax]、[cx+dx]、[ax+cx] 等 等 ， 都 是 非法 的 。 

因此 ， 源 程序 第 41 行 ， 把 初始 的 索引 值 4 传送 到 SI 寄存 器 ， 这 是 由 
于 要 先 显 示 万 位 上 的 数字 。 

源 程 序 第 43 行 ， 从 指定 的 内 存单 元 取出 一 个 字 节 ， 传 送 到 AL 寄存 
器 ， 偏 移 地 址 是 BX+SI。 但 是 ， 它 们 之 间 的 运算 并 非 是 在 编译 阶段 进行 
的 ， 而 是 在 指令 实际 执行 的 时 候 ， 由 处 理 器 完成 的 。 

源 程序 第 44 行 ， 将 AL 中 的 数字 加 上 0x30， 以 得 到 它 对 应 的 ASCII 
码 。 


源 程 序 第 45 行 ， 将 数字 0x04 传送 到 寄存 器 AH。0x04 是 显示 属性 ， 
即 前 面 讲 过 的 黑 底 红字 ， 无 加 亮 ， 无 闪烁 。 到 此 ，AX 中 是 一 个 完整 的 
字 ， 前 8 位 是 显示 属性 值 ， 后 8 位 是 字符 的 ASCII 码 。 


源 程序 第 46 行 ， 将 AX 中 的 内 容 传送 到 由 段 寄 存 右 ES 所 指 回 的 显示 
绥 冲 区 中 ， 偏 移 地 址 由 DI 指定 。 还 记得 吗 ， 在 前 面 使 用 movsw 传送 字符 
串 “Label offset>” 到 显示 绥 神 区 时 ， 也 使 用 了 DI， 当 时 DI 是 指 癌 显示 绥 冲 
区 首 地 址 的 0) ， 而 且 每 传送 一 次 就 自动 加 2。 传 送 结 束 后 ，DI1 正好 指 
向 字符 “:" 的 下 一 个 存储 单元 。 之 后 ，DI1 一 直 没 用 过 ， 还 保持 着 原先 的 内 

注意 ， 如 图 6-5 所 示 ， 数 据 的 传送 是 按 低 端 字 市 序 的 ， 寄 存 器 的 低 字 
节 传 送 到 显示 缓冲 区 的 低地 址 部 分 〈 字 节 ) ， 寄 存 器 的 高 字 节 传送 到 显 
示 绥 冲 区 的 高 地 址 部 分 〈 字 节 ) 。 

源 程序 第 47 行 ， 将 DI 的 内 容 加 上 2， 以 指向 显示 缓冲 区 的 下 一 个 单 
Zn。 

源 程序 第 48 行 ， 将 SI 的 内 容 减 1T， 使 得 下 一 次 的 BX+SI 指 癌 千 位 数 
字 。dec 是 减 一 指令 ， 和 inc 指令 一 样 ， 后 面 跟 一 个 操作 数 ， 可 以 是 8 位 
或 者 16 位 的 通用 寄存 器 或 者 内 存单 元 。 

源 程序 第 49 行 ， 指 令 jns show 的 意思 是 ， 如 果 未 设置 符号 位 ， 则 转 
移 到 标号 “show” 所 在 的 位 置 处 执行 。 如 图 6-2 所 示 ，lntel 处 理 器 的 标志 
寄存 器 里 有 符号 位 SF (Sign Flag) ， 很 多 算术 逻辑 运算 都 会 影响 到 该 
位 ， 比 如 这 里 的 dec 指令 。 如 果 计 算 结果 的 最 高 位 是 比特 "0"， 处 理 堪 把 
SF 位 置 “0"， 人 否则 SF 位 置 “1”。 

处 理 器 的 任务 是 忠实 地 执行 指令 ， 多 数 时 候 ， 它 不 会 知道 你 的 意 
图 ， 也 不 会 知道 你 进行 的 是 有 符号 数 运算 ， 还 是 无 符 亏 数 运 算 。 如 果 运 
算 结 果 有 的 最 局 位 是 1”， 它 唯一 所 能 做 的 ， 束 是 将 SF 标志 置 “1”"， 以 示 提 
桓 ， 剩 下 的 事 ， 你 目 己 看 着 办 ， 它 已 经 尽力 了 。 


B800:FFFF 寄存 器 AX 
ge = 


高 学 节 低 学 节 





ES:DI 上 


B800: wo | 


图 6-5 ” 低 问 字 节 序 的 字 传 送 示 意图 


由 于 SI 的 初始 值 为 4， 故 第 一 次 执行 dec si 后 ，si 的 内 容 为 3， 即 二 
进 制 数 0000000000000011， 符 号 位 是 比特 “0”， 处 理 器 将 标志 寄存 器 的 
SF 位 清 “0”"。 于 是 ， 当 执行 jns show 时 ， 符 合 条 件 ， 于 是 转移 到 标号 
“show” 所 在 的 位 置 处 执行 ， 等 于 是 开始 显示 下 一 个 数位 。 

当 显 示 完 最 后 一 个 数位 后 ，SI 的 内 容 是 零 。 执 行 dec si 指令 后 ， 由 
于 产生 了 借 位 ， 实 际 的 运算 结果 是 0xffff (SI 只 能 容纳 16 个 比特 ) ， 因 其 
最 高 位 是 “1"， 故 处 理 器 将 标志 位 SF 置 “1"， 表 明 当 前 SI 中 的 结果 可 以 理 
解 为 一 个 负数 〈 一 1) 。 于 是 ， 执 行 jns show 时 ， 条 件 不 满足 ， 接 着 执行 
后 面 第 51 行 的 指令 。 

jns 是 条 件 转 移 指 令 ， 处 理 占 在 执行 它 的 时 候 要 参考 标志 寄存 右 的 SF 
位 。 除 了 只 是 在 符合 条 件 的 时 候 才 转移 之 外 ， 它 和 jmp 指令 很 相似 ， 它 
也 是 相对 转移 指令 ， 编 译 后 的 机 器 指令 操作 数 也 是 一 个 相对 偏 移 量 ， 是 
用 标号 处 的 汇编 地 址 减 去 当前 指令 的 汇编 地 址 ， 再 减 去 当前 指令 的 长 度 
得 到 的 。 


6.9 其 他 标志 位 和 条 件 转移 指令 


在 处 理 右 内 进行 的 很 多 算术 远 辑 运 备 ， 部 会 影 啊 到 标志 寄存 名 的 蒜 
些 位 。 比 如 我 们 已 经 学 过 的 加 法 指令 add、 逆 辑 运 径 指 令 Xxor 等 。 在 下 面 
的 讲述 中 ， 请 目 行 参考 图 6-2。 


6.9.1 奇偶 标志 位 PF 


当 运 算 结果 出 来 后 ， 如 果 最 低 8 位 中 ， 有 偶数 个 为 1 的 比特 ， 则 
PF=1; 否则 PF=0。 例 如 : 


mo ax. L000L00L00104110B ay <— 0x092e 
XOr ax,3 ;结果 为 0x892d (1000100100101101B) 


顺序 执行 以 上 两 条 指令 后 ， 因 为 结果 是 1000100100101101B， 低 8 
位 是 00101110B， 有 偶数 个 1， 上 所 以 PF=1。 


再 如 : 
mov ahn.00100110B ah < 0x26 
moev al lil0000001B Sal <— QB1 
add ah,al -an < Ox3y 


以 上 ， 因 为 最 后 ah 的 内 容 是 0xa7 (10100111B，， 和 包含 奇数 个 1， 
故 PF=0。 


6.9.2 ”进位 标志 CF 


当 处 理 占 进行 算术 操作 时 ， 如 果 最 融 位 有 问 有 前 进位 或 信 位 的 情况 友 
生 ， 则 CF=1; 人 奋 则 CF=0。 比 如 : 


mov al,l10000000B al z= O80 
add al,al > = 0X00 


这 里 ， 寄 存 器 AL 自己 和 自己 做 加 法 运算 ， 并 因为 最 高 位 是 1 而 产生 
进位 。 结 果 是 ， 进 位 被 丢弃 ，AL 中 的 最 终结 果 为 零 。 进 位 的 产生 ， 使 得 
CF=1。 同 时 ，ZF=1，PF=1。 


下 和 面 是 因 有 代位 而 使 得 CF 为 1 的 例子 : 


mo ax 0 


SUD ax 1 


CF 标志 始终 忠实 地 记录 进位 或 者 价位 是 否 友 生 ， 但 少数 指令 除外 
(如 inc 和 dec) 。 


6.9.3 溢出 标志 OF 


对 于 无 符 扎 数 运算 来 说 ， 进 位 标志 CF 通常 意味 痢 得 到 了 错误 的 计算 
结 未 ， 因 为 目的 操作 数 没 能 容纳 那个 进位 。 这 里 有 一 个 例子 : 


mov ah Oxftt 


add ah,2 2a3n—0x0] 


执行 以 上 两 条 指令 后 ， 进 位 标志 CF 为 1， 这 是 肯定 的 了 ， 因 为 最 高 
位 有 进位 。 从 无 符号 数 的 角度 来 看 ， 是 255+2， 结 果 应 当 是 257。 但 是 你 
看 ， 因 为 寄存 器 AH 只 有 8 位 ， 所 以 进位 丢失 ， 得 到 的 结果 是 1， 这 明显 
是 错 的 。 

但 是 ， 如 果 上 面 进行 的 是 有 符号 数 运算 ， 那 么 ， 这 实际 上 是 在 计 
算 -1+2〈 十 进 制 ) ，AH 中 的 最终 的 结果 是 1， 这 是 正确 的 。 

很 显然 ， 同 样 的 运算 ， 从 无 符 亏 数 和 有 符号 数 的 视角 来 看 ， 是 不 同 
的 。 但 是 ， 在 所 有 的 情况 下 ， 处 理 器 都 不 可 能 知道 你 的 意图 ， 不 知道 你 
进行 的 是 有 符号 数 运 算 ， 还 是 无 符号 数 运算 。 为 此 ， 它 提供 了 次 出 标志 
OF， 该 标志 的 意思 是 ， 假 定 你 进行 的 是 有 符号 数 运 算 ， 如 果 运 算 结 果 是 
正确 的 ， 那 么 OF=0， 和 否则 OF=1。 比 如 上 面 的 例子 ， 因 为 从 有 符号 数 的 
角度 来 看 ， 是 -1 和 2 相 加 ， 结 果 为 1， 未 溢出 ， 故 OF=0。 人 简单 地 说 ，OF 
标志 用 于 指示 两 个 有 符号 数 的 运算 结果 是 否 错误 。 


mov ah,0Ox/0 


add ah,ah 


首先 ， 本 次 相 加 ， 用 二 进 制 数 来 说 就 是 
01110000+01110000=11100000， 最 高 位 没有 进位 ， 故 CF=0。 

其 次 ， 从 无 符号 数 的 角度 来 看 〈 十 进 制 ) ， 即 112+112=224， 并 未 
超出 一 个 字 节 上 所 能 容纳 的 数值 上 限 255， 结 果 是 正确 的 。 


但 是 ， 从 有 符号 数 运算 的 角度 来 看 “十进制 ) ， 即 112+112=-32， 两 
正 数 相 加 ， 结 果 为 负 ， 明 显 是 错 的 ， 在 这 种 情况 下 ，OF=1。 错 误 的 原因 
是 ， 两 个 正 数 112 和 112 相 加 ， 理 论 上 的 计算 结果 224 超出 了 寄存 器 AH 
所 能 容纳 的 有 符号 数 的 范围 -128 一 127， 所 以 破坏 了 符号 位 ， 使 得 结果 变 
成 了 负数 〈-32 ) 
既然 如 此 ， 可 以 使 用 16 位 寡 存 器 AX， 毕 竟 它 能 容纳 的 数据 范围 更 大 


-一 此 


一 -全 


moOY BX QI0 


add ax,ax 


这 次 ， 无 论 它 是 有 符号 数 运 算 ， 还 是 无 符 气 数 运 算 ， 结 束 都 是 正确 
的 。 故 CF=0，OF=0。 

因为 在 任何 时 候 ， 处 理 袁 都 不 可 能 知道 你 的 意图 ， 不 知 站 你 进行 的 
旦 有 符 气 数 运算 ， 还 是 无 符号 数 运 算 。 因 此 ， 写 所 能 做 的 ， 融 是 假定 进 
行 的 是 有 符 气 数 运算 ， 并 根据 结 示 近代 OF 标志 ， 全 于 如 何 处 理 ， 古 你 目 
己 的 事 。 比 如 说 ， 如 末 你 进行 的 是 无 符 亏 数 运算 ， 那 么 ， 你 可 以 不 用 理 


会 该 标 志 。 
6.9.4 现 有 指令 对 标志 位 的 影 员 


由 于 是 刚刚 接触 标志 位 ， 现 将 前 面 学 过 的 指令 对 标志 位 的 影响 一 一 
列举 如 下 。 在 往 后 的 学 习 中 ， 但 凡 过 到 新 的 指令 时 ， 除 了 讲解 指令 的 巧 
能 和 用 法 ， 也 会 说 明 其 对 标 专 位 的 影 啊 。 


注意 ， 可 以 在 Bochs 中 家 看 标志 位 的 状态 ， 有 具体 方法 请 参见 本 章 后 
面 的 6.12.3 节 。 


add OF、SF、2ZF、AF、CF 和 PF 的 状态 依 计算 结果 而 定 。 





chbw 不 影响 任何 标志 位 。 

cld DF=0，CF、OF、2ZF、SF、AF 和 PF 未 定义 。 未 定义 的 意思 是 到 目前 为 止 还 不 
打算 让 该 指令 影响 到 这 些 标 志 ， 因 此 ， 不 要 在 程序 中 依赖 这 些 标志 。 

cwd 不 影响 任何 标记 位 。 

dec CF 标志 不 受 影响 ， 因 为 该 指令 通常 在 程序 中 用 于 循环 计数 ， 而 且 在 循环 体内 通 


常 有 依赖 CF 标志 的 指令 ， 故 不 希望 它 打扰 CF 标志 ; 对 OF、SF、ZF、AF 和 
PF 的 影响 依 计 算 结果 而 定 。 
div/idiv 对 CF、OF、SF、2F、AF 和 PF 的 影响 未 定义 。 


inc CF 标志 不 受 影响 ， 对 OF、SF、2ZF、AF 和 PF 的 影响 依 计 算 结果 而 定 。 
mov/movs 这 类 指令 不 影响 任何 标志 位 。 

neg 如 果 操 作 数 为 0， 则 cF=0， 否 则 CEF=1; 对 OF、SF、ZF、AF 和 PF 的 影响 依 计 
std DEFE=1， 不 影响 其 他 标志 位 。 

sub 对 OF、SE、2ZEF、RAE、PE 和 CF 的 影响 依 计算 结果 而 定 。 

XOL OF=0，CF=0; 对 SF、ZF 和 PF 依 计算 结果 而 定 ; 对 AF 的 影响 未 定义 。 


6.9.5 条件 转 移 指 令 


“jcce” 不 是 一 条 指令 ， 而 是 一 个 指令 族 ( 秘 ) ， 功 能 是 根据 菜 些 条 件 
进行 转移 ， 比 如 前 面 讲 过 的 jns， 意 思 是 SFx1( 那 就 是 SF=0 了 ) 则 转 
移 。 方 便 起 见 ， 处 理 占 一 般 提 供 相 反 的 指令 ， 如 js， 意 思 是 SF=1 则 转 
移 。 爱 上 网 的 朋友 们 容易 把 它 理解 成 "奸商 ”。 


在 汇编 语言 源 代 码 里 ， 条 件 转 移 指令 的 操作 数 是 标号 。 编 译 成 机 器 
人 码 后 ， 操 作 数 是 一 个 立即 数 ， 是 相对 于 目标 指令 的 偏 移 量 。 在 16 位 处 理 
器 上 ， 偏 移 量 可 以 是 8 位 〈 短 转移 ) 或 者 16 位 〈 相 对 近 转 移 ) 。 

相似 地 ，jz 的 意思 是 ZF 标志 为 1 则 转移 ; jnz 的 意思 是 ZF 标志 不 为 
1 (为 0) 则 转移 。 

jo 的 意思 是 OF 标志 为 1 则 转移 ，jno 的 意思 是 OF 标志 不 为 1 (为 
0) 则 转移 。 

jc 的 意思 是 CF 标志 为 1 则 转移 ，jnc 的 意思 是 CF 标志 不 为 1 (为 0 ) 
则 转移 。 

jp 的 意思 是 PF 标志 为 1 则 转移 ，jnp 的 意思 是 PF 标志 不 为 1 (为 0 ) 
则 转移 。 爱 上 网 的 朋友 们 注意 了 ，jp 可 不 是 “极品 "的 意思 。 

转移 指令 必须 出 现在 影响 标志 的 指令 之 后 ， 比 如 : 


四 会 和 六 三 时 


]ns Show 


经 验证 明 ， 像 这 种 水 到 渠 成 的 情况 是 很 少 的 ， 多 数 时 候 ， 你 会 过 到 
一 些 和 标志 位 关系 不 太 明 显 的 问题 ， 比 如 ， 当 AX 寄存 器 里 的 内 容 为 0x30 
的 时 候 转 移 ， 或 者 当 AX 寄存 器 里 的 内 容 小 于 0xf0 的 时 候 转 移 ， 再 或 者 ， 
当 AX 寄存 器 里 的 内 容 大 于 寄存 器 BX 里 的 内 容 时 转移 ， 这 该 怎么 办 呢 ? 


好 在 处 理 此 提供 了 比较 指令 cmp， 它 十 要 两 个 操作 数 ， 目 的 操作 数 
可 以 是 8 位 或 者 16 位 通用 寄存 秦 ， 也 可 以 和 8 位 或 者 16 位 内 存单 元 ; 源 
操作 数 可 以 是 与 目的 操作 数 宽 度 一 致 的 通用 寄存 工 、 内 存单 元 或 者 立即 
数 ， 但 两 个 操作 数 同时 为 内 存单 元 的 情况 除外 。 比 如 : 


cm al,0x08 
emp gx Dx 


cms [label al, cx 


cmp 指令 在 功能 上 和 sub 指令 相同 ， 唯 一 不同 之 处 在 于 ，cmp 指令 
仅仅 根据 计算 的 结果 设置 相应 的 标志 位 ， 而 个 你 留 计 算 结 果 ， 因 此 也 束 
不 会 改变 两 个 操作 数 的 原 有 内 容 。cmp 指令 将 会 影响 到 CF、OF、SF、 
ZF、AF 和 PF 标志 位 。 


比较 是 拿 目 的 操作 数 和 源 操作 数 比 ， 重 点 关心 的 是 目的 操作 数 。 拿 
指令 cmp ax,bx 来 说 ， 我 们 关心 的 是 AX 中 的 内 容 是 否 等 于 BX 中 的 内 
容 ，AX 中 的 内 容 是 否 大 于 BX 中 的 内 容 ，AX 中 的 内 容 是 否 小 于 BX 中 的 
内 容 ， 等 等 ，AX 是 被 测量 的 对 象 ，BX 是 测量 的 基准 。 比 较 的 结果 如 表 
6-1 所 示 。 


表 6-1 各 种 比较 结果 和 相应 的 条 件 转移 指令 


Not Equal 相 减 结果 不 为 零 才 成 立 ， 故 要 求 ZF==0 
大 


适用 于 有 符号 数 比 较 
Greater 


要 求 : ZF 二 0 (两 个 数 不 同 ， 相 减 的 结果 不 为 零 )， 并 且 SF==OF 


(如 果 相 减 后 溢出 ， 则 结果 必须 是 负数 ， 说 明 目 的 操作 数 大 ， 如 果 
相 减 后 未 洪 出 ， 则 结果 必须 是 正 数 ， 也 表明 目的 操作 数 大 些 ) 
适用 于 有 符号 数 的 比较 
要 求 : SF 二 OF 
适用 于 有 符号 数 的 比较 
i E 要 求 ，ZF 二 1 两 个 数 相同 ， 相 减 的 结果 为 零 )， 或 者 SF 去 OF 
(如 果 相 减 后 溢出 ， 则 结果 必须 是 正 数 ， 说 明 源 操作 数 大 ;如果 相 

减 后 未 洲 出 ， 则 结果 必须 是 负数 ， 同 样 表明 源 操作 数 大 些 ) 

适用 于 有 符号 数 的 比较 

要 求 ，SF 关 OF 


人 于 a | 适用 于 有 符号 数 的 比较 ， 等 同 于 “不 大 于 等 于 ” 
要 求 ，SF 关 OF 


适用 于 有 符号 数 的 比较 ， 等 同 于 “不 大 于 ” 

小 于 等 于 Eee jle 要 求 : ZF 三 1〈 两 个 数 相同 ， 相 减 的 结果 为 零 )， 并 且 SF 去 OF 
(如 果 相 减 后 溢出 ， 则 结果 必须 是 正 数 ， 说 明 源 操作 数 大 ， 如 果 相 
减 后 未 流出 ， 则 结果 必须 是 负数 ， 同 样 表明 源 操作 数 大 些 ) 


mp ee ”| ”运用 于 有 符号 到 的 比较 ， 等 辣 于 “大 于 等 于 ” 
- 要 求 : SF 二 OF 


适用 于 有 符号 数 的 比较 ， 等 同 于 “大 于 ” 

要 求 : ZF 二 0 两 个 数 不 同 ， 相 减 的 结果 不 为 零 )， 并 且 SF=OF 
(如 果 相 减 后 溢出 ， 则 结果 必须 是 负数 ， 说 明 目 的 操作 数 大 ;， 如果 
相 减 后 未 洲 出 ， 则 结果 必须 是 正 数 ， 也 表明 目的 操作 数 大 些 ) 


EE EREETTTS 
村 于 
等 于 
， 


] 
] 
] 


ne 
jg 

ge 
ng 


不 大 于 等 于 Not Greater or Equal jnge 


不 小 于 等 于 Not Less or Equal 





TREE 


i Wi 适用 于 无 符号 数 的 比较 
四 要 求 :CF 二 0〔 没 有 进位 或 借 位 而 且 ZF 二 0( 两 个 数 不 相 同 》 
高 于 等 于 


适用 于 无 符号 数 的 比较 
要 求 : CF 二 0 目的 操作 数 大 些 ， 不 需要 借 位 ) 


不 高 于 Not Above jna 适用 于 无 符号 数 的 比较 ， 等 同 于 “ 低 于 等 于 ”( 见 后 ) 
. 要 求 : CF 二 1 或 者 ZF=1 


Ss Ss 在 忆 米 季 比较 ， 短 后 = my ( 见 后 ) 
不 高 于 等 于 Not Above or Equal jnae ee dis > 数 的 比较 ， 鹤 同 于 “ 低 于 ”( 见 后 


]a 
Above or Equal Jae 


适用 于 无 符号 数 的 比较 
和 Bel 
运用 于 无 符号 数 的 比较 
Bel E 1 ib 
运用 于 无 村 号 妆 9 比 外 ， 宇 河 辣 “ “高 - -等 和 


适用 于 无 符号 数 的 比较 ， 等 同 于 “高 于 ” 


不 低 于 等 于 Not Below or Equal jnbe i i 


校 验 为 偶 
检验 为 奇 Parity Odd 要 求 : PF 二 0 





非常 显而易见 的 是 ， 如 果 你 英语 基础 比较 好 ， 认 识 上 面 那 些 单词 的 
话 ， 这 些 指 令 都 可 以 在 短 时 间 内 轻松 记 住 。 英 语 基础 不 太 好 的 人 也 不 要 
灰心 ， 事 实 上 ， 根 本 不 需要 记 住 这 些 指令 和 它们 的 测试 条 件 ， 因 为 我 们 
平时 很 少 用 得 了 这 么 多 。 需 要 的 时 候 再 回 过 头 来 得 得 ， 这 是 个 好 办 法 ， 
时 间 一 长 ， 目 然 承 记 住 了 。 

最 后 一 个 要 讲述 的 条 件 转移 指令 是 jcxz (jump if CX is zero) ， 意 思 
是 当 CX 寄存 器 的 内 容 为 零 时 则 转移 。 执 行 这 条 指令 时 ， 处 理 器 先 测试 寄 
人 存 器 CX 是 人 耕 为 零 。 例 如 : 


Jcxz Show 


这 里 , “show" 是 程序 中 的 一 个 标号 。 执 行 这 条 指令 时 ， 如 果 CX 寄存 
器 的 内 容 为 零 ， 则 转移 ， 人 否则 不 转移 ， 继 续 往 下 执行 。 
检测 点 6.4 


1. ZF 标志 位 和 与 该 标志 位 有 关 的 条 件 转 移 指令 用 得 非常 频繁 ， 但 
很 多 人 容易 在 ZF 标志 位 上 犯 糊涂 ， 以 为 计算 绪 采 为 零 时 ，ZF 为 "0"。 为 
了 证 明 你 不 糊涂 ， 请 填空 当 ZF= ( ) 时 ， 表 明 计 算 结 果 为 零 ; jz 指令 
的 意思 是 当 ZF= ( ) ， 即 计算 结果 为 〈 ) 时 转移 ; je 指令 的 意思 是 当 
ZF=( ) ， 即 计算 结果 为 ( ) 时 转移 ; jnz 指令 的 意思 是 当 ZF= ( ) ， 
即 计算 结果 不 为 ) 时 转移 ; jne 指令 的 意思 是 当 ZF= ( ) ， 即 计算 结 
果 不 为 ( ) 时 转移 。 


2. 写 一 小 段 程序 ， 先 比较 寄存 器 AX 和 BX 中 的 数值 ， 然 后 ， 当 AX 
的 内 容 大 于 BX 的 内 容 时 ， 转 移 到 标 写 Ibb 处 执行 ，AX 的 内 容 等 于 AX 的 
内 容 时 ， 转 移 到 标 lbz 处 执行 ，AX 的 内 容 小 于 BX 的 内 容 时 ， 转 移 到 标号 
lbl 处 执行 。 


6.10 NASM 编译 右 的 $ 和 $$ 标记 


源 程序 第 51 行 ， 用 于 在 显示 了 各 个 数位 之 后 ， 再 显示 一 个 字符 “D”。 
目的 地 址 是 由 ES:DI 给 出 的 ， 源 操作 数 是 立即 数 0x0744， 其 中 ， 局 字 贡 
0x07 是 黑 后 日 字 的 显示 属性 ， 低 字 市 0x44 是 字符 “D" 的 ASCIl 人 码 。 字 的 
写 入 是 按 低 端 字 节 序 的 ， 请 自行 参照 图 6-5。 


整个 程序 到 此 结束 。 为 了 使 处 理 堪 还 有 事 做 ， 源 程序 第 53 行 ， 是 一 
个 无 限 循 环 。NASM 编译 右 提 供 了 一 个 标记 “$”， 访 标记 等 同 于 标号 ， 你 
可 以 把 它 看 成 是 一 个 隐藏 在 当前 行 行 首 的 标号 。 因 此 ，jmp near $ 的 意思 
是 ， 转 移 到 当前 指令 继续 执行 ， 它 和 


J "J near nt 


是 一 样 的 ， 没 有 区 别 ， 但 不 需要 使 用 标号 ， 更 不 必 为 给 标号 起 一 个 有 总 
义 的 名 字 而 伤 脑筋 。 

和 第 5 章 一 样 ， 为 了 得 到 不 多 不 少 ， 正 好 512 字 节 的 编译 结果 ， 同 时 
最 后 两 个 字 节 还 必须 是 0x55 和 0xAA， 需 要 在 所 有 指令 的 后 面 填充 一 些 无 
用 的 数据 。 

源 程 序 第 55 行 ， 用 于 重复 伪 指 令 “db 0" 和 若干 次 。 重 复 的 次 数 是 由 
510-($-$$) 得 到 的 ， 除 去 0x55 和 0xAA 后 ， 剩 余 的 主 引导 局 区 内 容 是 510 
字 节 ; $ 是 当前 行 的 汇编 地 址 ，$$ 是 NASM 编译 器 提供 的 另 一 个 标记 ， 代 
表 当 前 汇编 节 〈 段 ) 的 起 始 汇编 地 址 。 当 前 程序 没有 定义 节 或 段 ， 就 默 
认 地 自 成 一 个 汇编 段 ， 而 且 起 始 的 汇编 地 址 是 0《〈 程 序 起 始 处 ) 。 这 样 ， 
用 当前 汇编 地 址 减 去 程序 开头 的 汇编 地 址 (0) ， 就 是 程序 实体 的 大 小 。 
再 用 510 减 去 程序 实体 的 大 小 ， 殉 是 需要 项 充 的 字 节 数 。 

就 像 处 理 咒 把 内 存 划 分 成 逻辑 上 的 分 段 一 样 ， 源 程序 也 应 当 按 段 来 
组 织 ， 划 分 成 独立 的 代码 段 、 数 据 段 等 。 从 本 书 第 8 章 开始 ， 将 引入 这 方 
面 的 内 容 。 


6.11 观察 运 行 结 末 


编译 本 章 的 源 程 序 ， 并 用 FixVhdWr 将 编译 后 的 二 进 制 文件 写 入 虚拟 
硬盘 的 主 引 导 肩 区 ， 然 后 启动 VirtualBox， 观 察 运行 后 的 结果 。 在 你 的 程 
序 无 错 的 情况 下 ， 显 示 的 效果 应 当 如 图 6-6 所 示 。 





LEARN-ASM [正在 运行 ] - Oracle VM VirtualBox 一 ”号 j 2< 








多 D2 9 BRieht ctrl 


”图 6-6 ”本 章程 序 的 运行 结果 





6.12 ”本 章程 序 的 调试 


6.12.1 调试 命令 “n” 的 使 用 
要 调试 本 章 的 程序 ， 可 以 利用 上 一 章 里 介绍 的 方法 ， 其 中 非常 重要 


的 一 个 调试 命令 是 单 步 执行 命令 “S” 

单 步 执行 有 一 个 缺 扣 〖， 职 是 会 陷入 同一 条 指令 的 多 次 重复 执行 里 ， 
也 如 rep movsw 指令 。 如 图 6-7 所 示 ， 由 于 是 在 两 个 内 存 区 域 之 间 复 制 字 
付 ，rep movsw 指令 要 执行 很 多 次 ， 每 当 输 入 “Ss" 命 令 后 ， 执 行 的 依然 是 
movsw 指令 ， 百 多 寄存 闪 FCX 的 内 容 为 堆 ， 复 制 过 程 结 束 后 ， 才 开始 单 
步 执行 下 一 条 指令 。 注 意 ， 在 图 中 ，Bochs 使 用 了 rep movsw 指令 的 另 
一 种 形式 “rep movsw word ptr es:[dil,word ptr ds:[siY*Y， 它 们 其 实 是 一 回 
事 。 


<bochs:10> s 
Next at t:17825041 


(96)j [9x9906090060607c33] lol ; b90d 
00 





<bochs:11> s 

Next at t:17825042 

(0) LUXM OI] 0000:7c36 (unk. ): rep mousw word ptr es:[di], 
ptr ds:[si] f3a5 

《bochs:12> S 

Next at t:17825043 

(9)] [90x0900000000007c36] 0600:7 了 7c36 (unk . ): rep mousu word ptr es:[di], word 
ptr ds:[si] ; f3a5 

<bochs:13> s 

Next at t:17825044 

(9) [9x09960006009000607c36] 06060:7 了 c36 (unk. ) : rep mousa word ptr es:[dl]，M 
ptrF Us:[SIT] = f3a5 

《bochs:14> s 

Next at t=17825045 

(oD dololololololololololo oA! L011 ): rep movsw word ptr es:[di], word 
ptr ds:[s1i] ; f3a5 

<bochs:15> s 

Next at t:17825046 : 
pe st 0900 :7c36 (unk. ): rep mouswu word ptr es:[di], word 

s:[sS1] ; f3a5 





Pe :16》 


图 6-7 单 步 执行 rep movsw 指令 时 的 情景 


除了 rep movsw 指令 ， 本 章 中 的 loop 指令 也 会 使 单 步 执行 陷入 循环 
体 中 ， 卫 到 循环 条 件 不 成 立 ， 退 出 循环 时 ， 才 开始 单 步 执 行 循 环 体 外 的 
下 一 条 指令 。 如 图 6-8 所 示 ， 当 单 步 执行 循环 指令 loop .-9 时 《本 指令 的 
OO ， 下 一 条 指令 马上 变 成 循环 体 
内 的 第 一 条 指令 (xor dxdx ， 物 理 内 存 地 址 为 
0x0000000000007C43) 。 只 有 当 寄 存 需 CX 的 内 容 为 零 时 ， 才 开始 单 步 
执行 循环 体外 的 下 一 条 指令 。 


Fe 


Ne 时 和 风 17825059 
ololclololololclolsljoloite S001 到 









<bochs:21> 
四 Next at t=17825060 
(9) [GxQQ00000000000 7c45] 090 
<bochs:22> 5 


(0) [Gx0QG0000000007c47] 0000.;7cH4? 【un ctx mov 





四 <bochs: 237 Ss 


| C0): [ox xo060896600061 c49] 60906,7c49 (unk. ctxt): inc bx 


| 全 re c4a] 0000:7cHa (unk. ctx 


a 


Ne at 七 = 1 
(0) ne 0000;7cH3 (unk. ctx xor dx > 


图 6-8 ”Bochs 单 步 执行 loop 指令 时 的 情景 


在 图 中 ，loop 指令 的 目标 地 址 是 用 标号 “.-9" 表 示 的 ， 这 条 指令 束 是 
本 章程 序 中 的 指令 


lo0p dig1t 


但 是 ， 程 序 在 编译 后 ， 所 有 标号 都 消失 了 。 当 Bochs 重 现 这 些 程序 
时 ， 不 可 能 知道 这 里 原先 是 一 个 标号 “digit*。 因 此 ， 它 用 loop 指令 的 操作 
数 作 为 标号 。 我 们 知道 ，loop 指令 的 操作 数 是 一 个 相对 量 ， 是 用 目标 处 
的 汇编 〈 偏 移 ) 地址 减 去 当前 指令 的 汇编 〈( 偏 移 〉 地 址 ， 再 减 去 loop 指 
令 的 长 上 度 2) 得 到 的 。 因 此 ， 如 图 中 所 示 ，0x7c4a 减 去 0x7c43【〔 循 环 
体内 的 第 一 条 指令 xor dx,dx) ， 再 减 去 2， 只 保留 一 个 字 节 ， 束 是 0xf7， 
即 十 进 制 数 一 9。 

可 以 想象 ， 如 果 循 环 的 次 数 很 多 〈 有 时 候 ， 循 环 成 千 上 万 次 是 很 正 
第 的 ) ， 则 我 们 就 无 法 调试 循环 体 后 面 的 程序 。 在 这 种 情况 下 ， 你 应 当 
在 执行 rep movsb、repmovsw 和 |oop 指令 的 时 候 ， 使 用 调试 命令 “n” 
此 时 ，Bochs 将 目 动 完成 人 循环 过 程 ， 并 在 循环 体外 的 下 一 条 指令 前 售 
住 。 


6.12.2 调试 命令 “u” 的 使 用 


之 所 以 能 够 使 用 调试 命令 “hn oe re De 体 ， 是 因为 Bochs 知道 控制 
人 循环 座 数 的 是 寄存 如 CX， 它 可 以 目 动 监视 整个 循环 过 程 。 


但 是 ，“m" 命 仿 对 于 下 面 的 循环 结构 无 效 : 


Show : 
mov 1, [BX+s1i] 
add a 0x30 
mov ah,0O0x04 
mov [es:di],axx 
add di,2 
dec sil 


]ns Show 


原因 很 简单 ， 条 件 转移 指令 “〈 在 这 里 是 jns) 不 是 循环 指令 ， 转 移 到 
的 目标 位 置 一 般 位 于 前 方 〈 这 程 序 的 后 面 ) ， 而 不 是 像 这 里 一 样 ， 目 标 
位 置 是 先前 已 经 执行 过 的 指令 ， 于 是 恰巧 构成 了 一 个 特殊 的 循环 。 

因此 ， 如 图 6-9 所 示 ， 当 用 "命令 执行 jns show《〈 在 图 中 显示 的 是 
jns .-15) 后 ， 下 一 条 指令 又 变 成 物理 地 址 为 0x0000000000007c52 处 的 
指令 mov al,byte ptr ds:[bx+si] 〈 即 mov al,[bx+si] ) ， 因 为 SF 标志 大 
OO。 


如 何 越过 条 件 转 移 指令 构造 的 特殊 循环 体 ， 往 后 调试 执行 呢 ?” 要 解 
决 这 个 问题 ， 只 需要 知道 循环 体 后 面 那 条 指令 的 物理 地 址 即 可 ， 这 可 以 
使 用 反 汇 编 命令 “U”。 

反 汇编 的 意思 是 根据 机 器 指令 代码 生成 可 读 的 汇编 语言 指令 ， 正 好 
与 汇编 过 程 相反 。"u” 命 令 可 以 使 用 两 个 参数 ， 第 一 个 参数 是 跟 在 “后 和 面 
的 数字 ， 指 定 反 汇编 出 多 少 条 指令 ; 第 二 个 参数 用 于 指定 一 个 内 存 地 
址 ，Bochs 从 这 里 开始 反 汇编 操作 。 


8 Bochs for Windows = Console 
| a 


- n 
Next at t:17825086 
(0) [Ox0000000000007c52] 0000:7c52 (unk. movu al, byte ptr ds:[bx+s1i] ; 


00 
《bochs:33> n 
Next at t=17825087 
(9) Mb Aololololc Iolololololol or 0 | 人 add al，DOx30 


攻 [9xggg99099969997c56] 6990:7c56 (unk . mou ah，9xg4 


bochs:35> n 

Next at t:=17825089 

[oD ob lolololelolololololo lo LT: 0 mou word ptr e 
[EE 


I¢bochs :36> n 

INext at t:=17825090 

|(9) [9x6000000060007c5b] lo (unk . add di，Oxooo2 
[9 pa 


bochs:37> n 

INext at t:178253091 

[oD bd lolololc lololololololo eT ol ED dec sl 

<bochs:38> n 
MNext at t=17825092 

(0) [QOQx0000000000007cSF] 0000:7c5f (unk. jns .-15 (Ox00007c52) 





(0) [Ox00000000060007c52] 0000:7c52 (unk. mou al, byte ptr ds:[bx+si] ; 
00 





<bochs:40> 学 
3 EF 


图 6-9 在 Bochs 中 用 “nm” 命令 执行 jns 指令 时 的 情景 


如 图 6-10 所 示 ， 在 jns .-15 指令 执行 前 ， 用 “命令 反 汇 编 。 该 命令 
指示 从 指令 jns .-15 所 在 的 地 址 处 〈0x0000000000007c5f) 开始 反 汇 
编 ， 而 且 只 需 得 到 2 条 指令 即 可 。 注 意 ， 如 果 是 从 当前 地 址 处 开始 反 汇 
编 ， 则 地 址 参数 可 以 省 略 。 在 这 里 ， 只 需 使 用 “u/2” 即 可 。 


命令 下 达 后 ，Bochs 迅速 做 出 回应 ， 给 出 了 两 条 指令 ， 并 显示 了 各 
和 目 所 在 的 物理 地 址 。 很 显然 ， 条 件 转移 指令 jns 之 后 的 那 条 指令 是 mov 
word ptr es:[di],0x0744 ， 也 吏 是 本 章程 序 中 的 mov word 
[es:di],0x0744， 其 物理 地 址 是 0x7c61。 


依然 如 图 中 所 示 ， 为 了 越过 这 个 特殊 的 循环 结构 ， 首 先 使 用 “b" 命 令 
把 0x7c61 设 为 断 点 ， 然 后 执行 “c" 命 令 来 连续 执行 程序 ， 直 至 发 现 已 经 处 
于 断 点 位 置 。 





3 Bochs for Windows - Console 区 


<bochs:28> n 

Next at t:=17825089 

(0) [0x0000000000007c58] 0000:7c58 (unk. ctxt): mou word ptr es:[dlil]，ax  ; 
95 


ctxt): add di, OQx0002 


【9) [96x9000000000007cSse] 0000:7cS5e (unk. ctxt)j: dec Sil1 

《bochs:31> n 

Next at t:=:17825092 

(9) [Ox0000000000007c5f] 0660:7c5f (unk. ctxt): jns .-15 (Ox00007c52) 


《bochs:32> UA2 Oxr?cSf 
:Js -5 ; 7 了 9f1 
): mou word ptr es:;[di], OxO7H4 ; 26c7954407 


(9) Breakpoint 2, Ox0000000000007c61 in ?? () 

Next at t=17825121 

(9) [9xo9000000000007c61] 606000:7c61 (unk- ctxt]: mou word ptr es:[di]，DOxgor744 : 
6c7954407 

<bochs:35> 











图 6-10 ”使 用 反 汇 编 命 令 显 示 指 定 地 址 处 的 指令 
6.12.3 用 调试 命令 “info”" 窗 看 标志 位 


为 了 察看 标志 寄存 器 FLAGS 的 状态 〈 各 个 标志 位 ) ， 可 以 在 Bochs 
中 使 用 命令 "info"。 使 用 该 命令 可 以 显示 多 种 类 型 的 处 理 器 信息 ， 显 示 标 
志 寄存 器 的 状态 只 是 其 功能 之 


为 了 显示 标志 寄存 器 的 状态 ， 可 以 使 用 “eflags” 参 数 ， 即 “info 
eflags”"。INTEL8086 的 标志 寄存 器 是 16 位 的 ， 称 做 FLAGS; 在 32 位 处 
理 颖 上 ， 该 标志 守 存 右 做 了 扩展 ， 达 到 了 32 位 ， 称 做 EFLAGS。 因 此 ， 
在 Bochs 中 ， 应 当 输 入 "info eflags” 而 不是 “info flags”。 


要 察看 标志 寄存 器 # 的 状态 ， 应 当 在 调试 本 章程 序 的 过 才 程 中 进行 。 如 
图 6-11 所 示 ， 我 们 在 执行 第 33 行 的 xor dx,dx 指令 之 前 ， 穴 看 一 下 标志 
寄存 左 的 状态 。 


8 Bochs for Windows - Console 
(oD [96x6000000000007c361] 0000:7c36 (unk. ctxt) : 
ptr ds:[si] ; f3a5 


《bochs:12> hn 

Next at t:17825055 

(090) [60x690006000000067c38] 0000:7c38 (unk . 用 ， OxO01d 
00 





<bochs :13> n 
Next at t:17825056 
(0) [6x690000060000007c3b] 0000:7 了 7c3b (unk . 


， Ox0005 


sl，0Oxoo00a 


(9)j [6x90006000006007c431] 0000:7c43 (unk. ctxt)]: xor dx，dx 


《bochs:17> info eflags 
Id vip vif ac vm rf nt IOPL:0O of df if tf SF zf af pf cf 
<bochs:18> 


图 6-11 在 Bochs 中 察看 标志 寄存 器 的 状态 








如 图 中 所 示 ， 当 命令 输入 之 后 ，Bochs 显示 一 行 古 怪 的 文字 作为 回 
应 ， 请 允许 我 来 解释 一 下 这 些 东 西 都 是 什么 。 


首先 ， 像 “id、vip、vif、ac、vm、rf、nt、IOPL” 这 些 标 志 ， 是 32 位 
处 理 器 才 有 的 ， 现 在 不 用 管 它们 。 


然后 ， of 评注 出 标记 ; “df 是 方 同 标 志 ; 访 和 中 古 和 中 断 有 天 标 
志 ， 第 9 章 才 能 讲 到 ; “sf 是 符 亏 标志 ; “zf 是 零 祭 总 ; “af "是 辅助 进位 标 


专 ;“pf 是 奇偶 标 总 ; “cf 是 进位 标志 。 


问题 是 ， 光 显示 标志 的 名 称 ， 怎 么 知道 某 个 标志 位 是 "0" 还 是 “1" 呢 ? 
很 简单 ， 如 果 显 示 的 标志 名 称 是 小 写 的 ， 那 么 ， 说 明 该 标志 为 "0”， 硬 
则 ， 该 标志 的 状态 为 1"。 如 图 中 所 示 ， 因 为 符号 标志 是 大 写 的 “SF”"”， 因 
此 ， 表 明 该 标志 当前 的 状态 是 1” 


注意 ， 我 们 现在 关注 的 是 当 xor 指令 执行 后 ， 标 志和 寄存 占 的 变化 情 
况 。 接 下 来 ， 我 们 单 步 执 行 xor dx,dx 指令 ， 然 后 再 显示 一 次 标志 寄存 器 
的 内 容 。 


如 图 6-12 所 示 ， 该 指令 执行 后 ， 符 号 标志 的 名 称 变 成 小 写 ， 零 标志 
和 奇偶 标志 的 名 称 变 为 大 写 。 请 你 想 一 想 ， 这 是 为 什么 ? 


3 Bochs for Windows - Console 0° 2 


《bochs:13> n 
Next at t:17825056 
(9) [9x00090000000007c3b] 9000:7 了 c3b (unk. ctxt)j: mou bx， 





《bochs:14> n 

Next at t=17825057 

[oD [0x000006066000rc3d] 0000:7c3d 0 
DO 


= 


<bochs:15> nm 
Next at t=:17825058 
) [9x0000000000007c401 909000:7c40 (unk. ctxt): mou sS1，0xg9o00a 


(9)] [9x6666600696697c43] 60699:7c43 (unk.， ctxt)]: xor dx，dx 


《bochs:17> info eflags 

ld vip vif ac um rf nt IOPLzO of df If tf SF zf af pf cf 
<bochs:18> s 

Next at t:17825060 

(90)] [6x00600060000007c45] 0000:7c45 (unk. ctxt): diu ax，SsS1 


《bochs:19> Info eflags 
Id vip vif ac um rf nt IOPLzO of df If tf sf ZF af PF cf 
《bochs:20> 














图 6-12 xor dx,dx 指令 对 标志 寄存 器 的 影 啊 


检测 点 6.5 

调试 本 章程 序 。 要 求 : 使 用 反 汇 编 命令 定位 到 源 程 序 第 53 行 (jmp 
near$) ， 然 后 在 这 里 设置 断 点 ， 并 用 “ce” 命令 连续 执行 到 该 断 点 位 置 。 
注意 ， 因 为 Bochs 会 把 非 指 令 的 数据 也 视 为 指令 ， 这 将 有 可 能 导致 反 汇 
编 不 正确 。 因 此 ， 要 小 心 避 开 这 些 数 据 区 ， 在 Bochs 把 物理 地 址 0x7C00 
之 后 的 数据 (一 大 堆 零 ) 也 反 汇编 成 指令 时 ， 不 要 感到 惊讶 。 


本 章 习 题 


1， 在 未 程序 中 声明 和 初始 化 了 以 下 的 有 符 扎 数 。 请 问 ， 正 数 和 负数 
各 有 和 多少? 


Satal QB VX05 0xZtLt Ux80,. TU O97 O03 
data2 OW Ox90 0xtff0 0%a0 ,Uxl1230. Ux2Z2t, 0xXc0 RECSSC 


2. 如 和 可 能 的 话 ， 答 试 编 与 一 个 主 引 寻 刷 区 程序 来 做 上 面 的 工作 。 
3. 请 问 下 面 的 循环 将 执行 多 少 次 : 


ee 


delay: loop delay 


第 7 章 ” 比 高 斯 更 快 的 计算 
7.1 从 1 加 到 1.0 ”的 故事 


伟大 的 数学 家 高 斯 在 9 岁 那 年 ， 用 很 短 的 时 间 完成 了 从 1 到 100 的 累 
加 。 那 原本 是 老师 给 学 生 们 出 的 难题 ， 希 望 他 们 能 老 老实 实地 待 在 教室 
里 。 


高 斯 的 方法 很 简单 ， 他 发 现 这 是 50 个 101 的 求 和 : 100 十 1、99 十 
2、98 十 3、...、50 十 51， 于 是 他 很 快 算出 结果 是 101x50 二 5050。 从 1 加 
有 100， 高 斯 发 现 了 其 中 的 规律 ， 当 然 很 快 就 能 算出 结果 。 但 是 计算 机 很 
大 ， 它 不 懂 什 么 规律 ， 只 能 从 1 老 老 实 实 地 加 到 100。 不 过 ， 它 的 强项 整 
是 速度 ， 而 且 不 怕 有 麻烦， 当 高 斯 还 在 审题 的 时 候 ， 它 就 累加 出 结果 了 。 

计算 累加 和 对 计算 机 来 说 是 小 菜 一 碟 ， 而 这 也 不 是 本 章 的 目的 。 本 
章 的 目标 是 : 

1. 通过 计算 1 到 100 的 累加 和 ， 学 习 一 种 重要 的 数据 结构 
了 解 处 理 喜 为 访问 栈 提 供 了 怎样 的 文 持 。 

2. 总 结 INTEL8086 处 理 器 的 寻 址 方式 。 

3. 学 习 几 个 新 的 处 理 器 指令 ， 它 们 是 or、and、push 和 pop。 

4. 学习 在 Bochs 中 调试 程序 时 察看 栈 的 方法 。 





栈 ， 


7.2 ”代码 清单 7-1 





7.3 ”显示 字符 串 


源 程 序 第 8 行 ， 声 明 并 初始 化 了 一 串 字 符 《〈 字 符 串 ) ， 它 的 最 终 用 途 
皇 要 电 示 在 屏 医 上。 我 们 可 以 二 接 用 单 引 扎 把 一 串 字 符 围 起 来 : 


ee 


NASM 文 持 这 样 的 做 法 ， 同 前 一 重 相 比 ， 以 这 种 方法 声明 字符 串 受 
得 更 方便 、 更 和 直接。 在 编 详 阶 段 ， 编 详 卓 将 把 它们 拆 开 ， 以 形成 一 个 个 
单独 的 字 蔬 。 


为 了 跳 过 没有 指令 的 数据 区 ， 源 程序 第 6 行 古 jmp near start 指令 。 


源 程 序 第 11 一 15 行 用 于 初始 化 数据 段 寄 存 礁 DS 和 附加 段 寄存 砷 
ES. 


源 程序 第 18 一 28 行 同 样 用 于 最 示 字符 串 ， 但 采用 了 不 同 的 方法 ， 首 
先是 用 有 系 引 寄存 髓 SI 指 问 DS 段 内 竺 显示 字符 串 的 首 地 址 ， 即 标号 
message" 所 代表 的 汇编 地 址 。 然 后 ， 再 用 另 一 个 索引 寄存 髓 DI 指 癌 ES 
段 内 的 偏 移 地 址 0 处 ，ES 是 指向 0xB800 段 的 。 


字符 串 的 显示 需要 依赖 循环 。 本 次 采用 的 是 循环 指令 loop。loop 指 
令 的 工作 又 依赖 于 CX 寄存 器 ， 所 以 ， 源 程序 第 20 行 ， 用 于 在 编译 阶段 
计算 一 个 循环 次 数 ， 访 循环 次 数 等 于 字符 串 的 长 度 〈 字 人 符 个 数 ) 。 

循环 体 是 从 源 程序 第 22 行 开始 的 。 首 先 从 数据 段 中 ， 逻 辑 地 址 为 
DSI:SI 的 地 方 取得 第 一 个 字符 ， 将 其 传送 到 逻辑 地 址 ES:DI， 后 者 指 回 最 
示 绥 冲 区 。 

紧 接着 ， 源 程序 第 24 行 ， 将 DI 的 内 容 加 一 ， 以 指 癌 该 字符 在 显示 绥 
冲 区 内 的 属性 字 节 ; 第 25 行 ， 在 该 位 置 写 入 属性 值 0x07， 即 黑 底 白字 。 

源 程 序 第 26、27 行 ， 分 别 将 寄存 占 Sl 和 DI 的 内 容 加 一 ， 以 指 问 源 
位 置 和 目标 位 置 的 下 一 个 单元 。 

源 程 序 第 28 行 ， 执 行 循环 。loop 指令 在 执行 时 先 将 CX 的 内 容 减 
一 ， 然 后 ， 处 理 噩 根据 CX 是 否 为 零 来 决定 是 否 开始 下 一 轮 循 环 。 当 CX 
为 0 的 时 候 ， 说 明 所 有 的 字符 已 经 显示 完毕 。 


7.4 计算 1 到 100 的 累加 和 


接 下 来 就 是 计算 1 到 100 的 累加 和 了 。 处 理 器 还 没有 智能 到 可 以 理解 
题 意 的 程度 ， 有 具体 的 计算 方法 和 计算 步骤 只 能 由 人 来 给 出 。 


要 计算 1 到 100 的 宗 加 和 ， 可 以 采取 这 样 的 办 法 : 先 将 寄存 右 AX 清 
零 ， 再 用 AX 的 内 容 和 1 相 加 ， 结 果 在 AX 中 ; 接着， 再 用 AX 的 内 容 和 2 
相 加 ， 结 果 依 旧 在 AX 中 ，......， 就 这 样 一 直 加 到 100。 

为 此 ， 源 程序 第 31 行 ， 用 xor 指令 将 寄存 右 AX 清 零 ; 产程 序 第 32 
行 ， 将 第 一 个 被 累加 的 数 " 人 传送 到 寄存 器 CX。 

源 程 序 第 34 行 就 开始 累加 了 ， 每 次 相 加 之 后 ， 源 程序 第 35 行 ， 将 
CX 的 内 容 加 一 ， 以 得 到 下 一 个 将 要 累加 的 数 。 

源 程 序 第 36 行 ， 将 CX 的 内 容 同 100 进行 比较 ， 看 是 不 是 已 经 累加 
到 100 了 。 如 果 小 于 等 于 100， 则 继续 重复 累加 过 程 ， 如 果 大 于 100， 就 
不 再 累加 ， 直 接 往 下 执行 。 


最 后 ，AX 中 将 得 到 最 终 的 累加 和 。 需 要 特别 说 明 的 是 ，AX 可 以 容 
纳 的 无 全 写 数 最 大 是 65535， 再 大 束 不 行 了。 由 于 我 们 已 经 知道 最 终 的 结 
条 是 5050， 上 所 以 很 放心 地 使 用 了 寄存 右 AX。 要 是 你 从 1 加 到 1000， 束 得 
考 谍 使 用 两 个 寄存 器 来 计算 了 。 


7.5 累加 和 各 个 数位 的 分 解 与 显示 


7.5.1 ” 栈 和 栈 段 的 初始 化 
得 到 了 累加 和 之 后 ， 下 面 的 工作 是 将 它 的 各 个 数位 分 解 出 来 ， 并 准 
备 在 屏幕 上 显示 ， 好 让 我 们 知道 这 个 数 到 底 是 多 少 。 


和 前 两 章 不 同 ， 分 解 出 来 的 各 个 数位 并 不 你 人 存在 数据 段 中 ， 而 保存 
在 一 个 叫做 栈 的 地 方 。 


压 本 出 栈 栈 (Stack) 是 一 种 特殊 的 数据 存储 结 


We 4+”  ” 构 ， 数 据 的 存 取 只 能 从 一 端 进行 。 这 样 ， 
和 7 最 先进 去 的 数据 只 能 最 后 出 来 ， 最 后 进去 
的 数据 倒是 最 先 出 来 ， 这 称 为 后 进 先 出 
(Last In First Out，LIFO ) 。 如 图 7-1 所 
未 ， 可 以 把 栈 看 成 一 个 一 六 开口 的 塑料 
ee 和 板 ，1 号 球 最 先 放 进去 ，3 亏 球 最 后 放 进 
去 ， 只 能 在 3 号 球 和 2 亏 球 分 别 取 出 后 ， 才 
能 把 1 号 球 取 出 来 。 
听 起 来 像 是 在 讲 如 何 往 盒 子 里 放 东 
西 ， 或 者 从 盒子 里 取 东 西 。 实 际 上 上， 我们 
还 是 在 讲 内 存 ， 只 不 过 是 另 一 种 特殊 的 读 
图 7-1 一 个 说 明 栈 工作 原理 的 类 比 写 方式 而 已 。 
和 代码 段 、 数 据 段 和 附加 段 一 样 ， 栈 
也 被 定义 成 一 个 内 存 段 ， 叫 栈 段 (Stack Segment) ， 由 段 寄 存 器 SS 指 
问 。 


针对 栈 的 操作 有 两 种 ， 分 别 是 将 数据 推进 栈 (push) 和 从 栈 中 弹出 
数据 (pop) 。 人 简单 地 说 ， 束 是 压 栈 和 出 栈 。 压 栈 和 出 栈 只 能 在 一 端 进 
行 ， 所 以 需要 用 栈 指针 寄存 器 SP (Stack Pointer) 来 指示 下 一 个 数据 应 
当 压 入 栈 内 的 什么 位 置 ， 或 者 数据 从 哪里 出 栈 。 


定义 栈 需 要 两 个 连续 的 步 台 ， 即 初始 化 段 等 存 器 SS 和 栈 指针 SP 的 
内 容 。 源 程序 第 40 一 42 行 用 于 将 栈 段 的 段 地 址 设置 为 0x0000， 栈 指针 的 
内 容 设 置 为 0x0000。 


到 目前 为 止 ， 我们 已 经 定义 了 3 个 段 ， 图 7-2 是 当前 的 内 存 布局 。 
的 内 存 容 量 是 1IMB， 物 理 地 址 的 范围 是 0Ox00000 一 0xFFFFF， 其 中 ， 
定数 据 段 的 长 度 是 64KB 《实际 上 它 的 长 度 无 关 紧 要 ) ， 占据 了 物理 地 址 
0x07C00 一 0x17BFF ， 对 应 的 逻辑 地 址 范围 是 0x07C0:0x0000 一 
0x07C0:0xFFFF; 代码 段 和 栈 段 是 同一 个 段 ， 占 据 着 物理 地 址 0x00000 
~ 0xOFFFF ， 对 应 的 人 敢 辑 地 址 泡 是 0x0000:0x0000 一 
Ox0000:0xFFFF。 


FFEFFE 


17BFF 
| | 


07C00 。 主 引导 扇 区 的 内 容 | 代码 段 和 堆栈 段 


CS 二 SS 二 0000 


00000 


图 7-2 ”本 章程 序 的 内 存 布 局 


里 然 代 人 码 段 和 栈 段 在 本 质 上 指 问 同 一 块 内 存 区域 ， 但 是 个 要 担心 ， 
主 引 导 程序 只 占据 看 中 间 的 一 小 部 分 ， 我 们 有 办 法 让 它们 互 不 干扰 。 


7.5.2 ”分解 各 个 数位 并 压 栈 


数位 的 分 解 还 是 得 靠 做 除法 。 源 程序 第 44 行 用 于 把 除数 10 传送 到 寄 
存 器 BX。 

以 往 分 解 寄存 器 AX 中 的 数 时 ， 固 定 是 分 解 5 次 ， 得 到 5 个 数位 。 但 
这 也 存在 一 个 缺点 ， 如 果 AX 中 的 数 很 小 时 ， 在 屏幕 上 显示 的 数 左 边 都 是 
“0"”， 这 当然 是 很 别扭 的 。 为 此 ， 本 章 的 源 程 序 做 了 改善 ， 每 次 除法 结 
后 ， 都 做 一 次 判断 ， 如 果 商 为 0 的 话 ， 分 解 过 程 可 以 提前 结束 。 

但 是 ， 由 于 每 次 得 到 的 数位 是 压 入 栈 的 ， 将 来 还 要 反 序 从 栈 中 弹 
出 ， 为 此 ， 必 须 记 住 实际 上 到 底 有 多 少 个 数位 。 源 程序 第 45 行 ， 将 寄存 
器 CX 清 零 ， 并 在 后 面 的 代码 中 用 于 累计 有 多 少 个 数位 。 

源 程 序 第 47 一 53 行 也 是 一 个 循环 体 ， 每 执行 一 次 ， 分 解 出 一 个 数 
位 。 每 次 分 解 时 ，CX 加 一 ， 表 明 数 位 又 多 了 一 个 ， 这 是 源 程 序 第 47 行 
所 做 的 事 。 

源 程 序 第 48、49 行 ， 将 DX 清 零 ， 并 和 AX 一 起 形成 32 位 的 被 除 
数 。 

分 解 出 的 数位 将 来 要 显示 在 屏幕 上 上， 为 了 方便 ， 源 程序 第 50 行 ， 直 
接 将 AL 中 的 商 “ 加 上 ?0x30， 以 得 到 该 数字 所 对 应 的 ASCII 码 。 

注意 上 一 段 话 中 的 引号 。 这 并 不 是 真正 的 加 法 ，or 并 不 是 相 加 的 指 
令 ， 但 由 于 此 处 的 特殊 情况 ， 使 得 or 指令 的 执行 结果 和 相 加 是 一 样 的 。 

与 xor 一 样 ，or 也 是 逻辑 运算 指令 。 不 同 之 处 在 于 ，or 执行 的 是 逻 
辑 “ 或 "。 数 字 人 逻辑 中 的 "或 "用 于 表示 两 个 命题 并 列 的 情况 。 如 果 0 代表 
假 ，1 代表 真 ， 那 么 : 


Oro0=0 
gmr =] 
lorDd= 1 
S11= 1 


在 处 理 天 内 部 ，or 指令 的 目的 操作 数 可 以 是 8 位 或 者 16 位 的 通用 寄 
人 存 般 ， 或 着 包含 8/16 位 实际 操作 数 的 内 存单 元 ， 源 操作 数 可 以 是 与 目的 
操作 数 数据 宽度 相同 的 通用 寄存 规 、 内 存单 元 或 者 立即 数 。 比 如 : 


SE 上 帮工 

Or dX Cx 
Grass ex 
or byte [bx|; O055 


和 其 他 指令 一 样 ，or 指令 不 允许 目的 操作 数 和 源 操 作 数 都 是 内 存单 
元 的 情况 。 当 or 指令 执行 时 ， 两 个 操作 数 相对 应 的 比特 之 间 分 别 进行 各 
目的 逻辑 或" 运算， 结果 位 于 目的 操作 数 中 。 举 个 例子 ， 以 下 指令 执行 
后 ， 寄 存 器 AL 中 的 内 容 是 0xff。 


Le 


or al, Oxaa 


青 来 看 源 程 序 第 50 行 ， 因 为 每 次 是 除 以 10， 所 以 在 寄存 需 DL 中 得 
到 的 余数 ， 其 高 4 位 必定 为 0。 义 由 于 0x30 的 低 4 位 挟 0， 高 4 位 是 3， 所 
以 ，DL 中 的 内 容 和 0x30 执行 效 辑 "或" 后， 相当 于 是 将 DL 中 的 内 容 和 
0x30 相 加 。 这 征用 泌 辑 "或 "指令 做 加 法 的 一 个 特例 。 


or 指令 对 标志 寄存 器 的 影响 是 ， OF 和 CF 位 被 清 零 ，SF、ZF、PF 
位 的 状态 依 计算 结果 而 定 ，AF 位 的 状态 未 定义 。 


与 or 相对 应 的 是 逻辑 与 “and”。 如 果 0 代表 假 ，1 代表 真 ， 那 么 


0 and 0 
0 and 1 
1 ang 0 
1 WA 


相应 地 ， 处 理 器 设计 了 and 指令 。 在 16 位 处 理 器 上 ，and 指令 的 两 
个 操作 数 部 应 当 是 字 市 或 者 字 。 其 中 ， 目 的 操作 数 可 以 是 退 用 寄存 占 和 和 
站 存单 元 ;， 源 拘 作 数 可 以 是 通用 寄存 厅 、 内 存单 元 或 者 立即 效 ， 但 不 多 
许 两 个 操作 数 同时 为 内 存单 元 ， 而 且 和 它们 在 数据 宽度 上 应 当 一 致 。 比 
如 : 


= 


and 1 ,00X95 

and Shs 

and ax,dx 

and llabel alyah 
and Word [BX| ,0%E0E0 


and dx, [bx+s1] 


注意 ，“label a" 是 一 个 标号 ， 下 同 。 

当 这 些 指 令 执 行 时 ， 两 个 操作 数 对 应 的 各 个 比特 位 分 别 进行 逻辑 
与 ”， 结 果 保 存在 目的 操作 数 中 。 因 此 ， 下 面 的 这 些 指令 执行 后 ， 寄 存 需 
AX 中 的 结果 是 二 进 制 数 1000000000000100， 即 0x8004: 


mov ax 1001 O11 0000 9100B 
nd SU 90009 T1111 111IB 


and 指令 执行 后 ，OF 和 CF 位 被 清 零 ，SF、ZF、PF 位 的 状态 依 计 
算 结果 而 定 ，AF 位 的 状态 未 定义 。 各 个 数位 的 ASCII 码 是 压 入 栈 中 的 。 
源 程序 第 51 行 ，push 指令 的 作用 是 将 寄存 器 DX 的 内 容 压 入 栈 中 。 在 16 
位 的 处 理 堪 上 ，push 指令 的 操作 数 可 以 是 16 位 的 寄存 器 或 者 内 存单 元 。 
例如 : 


push ax 


bush Word [label al 


你 可 能 觉得 奇怪 ，push 指令 只 接受 16 位 的 操作 数 ， 为 什么 要 对 内 存 
操作 数 使 用 关键 字 “word”"。 事 实 上 ，8086 处 理 器 只 能 压 入 一 个 字 ;， 但 其 
后 的 32 位 和 64 位 处 理 器 允许 压 入 字 、 双 字 或 者 四 字 ， 因 此 ， 关 键 字 是 必 
不 可 少 的 。 


束 8086 处 理 占 来 说 ， 因 为 压 入 栈 的 内 容 必 须 是 字 ， 所 以 ， 下 面 的 指 
令 者 是 非法 的 : 


push al 
puash pyte |lJabel al 


处 理 占 在 执行 push 指令 时 ， 衣 先 将 栈 指 针 寄 和 存 莫 SP 的 内 容 减 去 操 
作 数 的 字 长 〈 以 字 节 为 单位 的 长 度 ， 在 16 位 处 理 硕 上 是 2) ， 然 后 ， 把 
要 压 入 栈 的 数据 存放 到 逻辑 地 址 SS:SP 所 指向 的 内 存 位 置 (和 其 他 段 的 
读 写 一 样 ， 把 栈 段 寄存 融 SS 的 内 容 左 移 4 位 ， 加 上 栈 指 针 寄 和 存 桌 SP 所 
供 的 仿 移 地 址 〉。 


如 图 7-3 所 示 ， 代 码 段 和 栈 段 是 同一 个 段 ， 所 以 段 寄存 右 CS 和 SS 
的 内 容 剖 是 0x0000。 而 且 ， 栈 指针 寄存 右 SP 的 内 容 在 源 程序 第 42 行 被 
置 为 0。 所 以 ， 当 push 指令 第 一 次 执行 时 ，SP 的 内 容 减 2， 即 0x0000 一 
0x0002 二 0xFFFE， 借 位 被 急 略 。 于 是 ， 被 压 入 栈 的 数据 ， 在 内 存 中 的 位 


置 实际 上 是 0x0000:0xFFFE。push 指令 的 操作 数 是 字 ， 而 且 Intel 处 理 需 
是 使 用 低 端 字 节 序 的 ， 故 低 字 节 在 低地 址 部 分 ， 高 字 节 在 高 地 址 部 分 ， 
正好 占据 了 栈 段 的 最 高 两 个 字 节 位 置 。 

这 只 是 第 一 次 压 栈 操作 时 的 情况 。 以 后 每 次 压 栈 时 ，SP 都 要 依次 减 
2。 很 明显 ， 不 同 于 代码 段 ， 代 码 段 在 处 理 占 上 执行 时 ， 是 由 低地 址 并 问 
高 地 址 端 推进 的 ， 而 压 栈 操作 则 正好 相反 ， 是 从 高 地 址 端 癌 低地 址 端 推 
进 的 。 


push 指令 不 影响 任何 标志 位 。 


0000 :FFFE 低 字 节 





第 一 次 压 栈 时 ，SP 二 0xFFFE 


堆栈 的 推进 方 癌 





程序 的 执行 方 癌 


主 引 导 户 区 的 内 容 
0000:7C00 


图 7-3 第 一 次 执行 压 栈 操作 时 的 内 存 状 态 


源 程 序 第 52、53 行 ， 判 断 本 次 除法 结束 后 ， 商 是 人 否 为 0。 如 末 不 为 
去 ， 则 再 循环 一 次 ; 如 来 为 零 ， 则 表明 不 需要 再 继续 分 解 了 。 


7.5.3 ”出 栈 并 显示 各 个 数位 


压 栈 的 次 数 〈“ 数 位 的 个 数 ) 取决 于 AX 中 的 数 有 多 大 ， 位 于 寄存 厚 
CX 中 。 数 位 是 近 " 个 位 “人 “十 位 和 “ 昕 位 “王位 “万 位 的 顺序 依次 压 
栈 的 《实际 情况 取 雇 于 数 的 大 小 ) ， 出 栈 正 好 相反 。 上 所 以 ， 可 以 顺序 将 
它们 弹出 栈 并 显示 在 屏 硕 上。 








源 程 序 第 57 行 ，pop dx 指令 的 功能 是 将 逻辑 地 址 SS:SP 处 的 一 个 
字 弹 出 到 寄存 器 DX 中 ， 然 后 将 SP 的 内 容 加 上 操作 数 的 字 长 (2) 。 


和 push 指令 一 样 ，pop 指令 的 操作 数 可 以 是 16 位 的 寄存 器 或 者 内 存 
单元 。 例 如 : 


pop ax 
Bop word [label al 


pop 指令 执行 时 ， 处 理 带 将 栈 段 宁 存 桌 SS 的 内 容 左 移 4 位 ， 册 加 上 
栈 指针 寄存 右 SP 的 内 容 ， 形 成 20 位 的 物理 地 址 访问 内 存 ， 取 得 所 需 的 
数据 。 然 后 ， 将 SP 的 内 容 加 操作 数 的 字 长 ， 以 指 癌 下 一 个 栈 位 置 。 


pop 指令 不 影响 任何 标志 位 ， 

源 程序 第 58 行将 弹出 的 数据 写 入 显示 缓冲 区 。 索 引 寄存 器 DI 的 内 容 
是 在 前 面 显示 字符 串 时 用 过 的 ， 期 间 一 直 没 有 改变 过 ， 它 现在 指向 显示 
缓冲 区 中 字符 串 之 后 的 位 置 。 

接着 ， 源 程序 第 59~61 行 ， 将 字符 显示 属性 写 入 字符 之 后 的 单元 ， 
并 再 次 递增 DI 以 指向 显示 缓冲 区 中 下 一 个 字符 的 位 置 。 

源 程序 第 62 行 ， 每 次 执行 loop 指令 时 ， 处 理 器 都 是 先 将 寄存 器 CX 
减 一 。 当 所 有 的 数位 都 弹出 和 显示 以 后 ，CX 必定 为 零 ， 这 将 导致 退出 特 
环 。 

当 处 理 器 最 后 一 次 执行 出 楼 操作 后 ， 栈 指针 寄存 器 SP 的 内 容 将 恢复 
到 最 开始 设置 时 的 状态 ， 即 它 的 内 容重 新 为 0。 


7.5.4 ”进一步 认识 栈 


学 习 栈 的 知识 ， 最 好 是 和 完 有 一 些 感性 认识 ， 本 章 束 是 这 么 做 的 。 现 
在 ， 感 性 认识 己 丝 有 了 ， 剩 下 的 ， 融 是 总 结 一 下 ， 做 几 点 说 明 。 

第 一 ，push 指令 的 操作 数 可 以 是 16 位 寄存 器 或 者 16 位 内 存单 元 ， 
push 指令 执行 后 ， 压 入 栈 中 的 仅仅 是 该 寄存 厚 或 者 内 存单 元 里 的 数值 ， 
与 设 寄 和 存 带 或 内 存 早 元 个 由 相干 。 如 来 不 理解 这 一 操 ， 束 容易 蚀 误 地 以 
为 压 入 了 某 个 寄存 器 的 值 ， 比 如 AX 之 后 ， 将 来 还 要 再 弹 回 AX 才 行 ， 这 
征 不 对 上 的。 所以， 下面 的 指令 是 合法 而 且 正 确 的 : 


BuUush Cs 


BOD ds 


这 两 条 指令 的 意思 是 ， 将 代码 段 寄存 胡 的 内 容 压 栈 ， 并 弹出 到 数据 
段 寄存 器 DS。 如 此 一 来 ， 代 人 码 段 和 数据 段 将 属于 同一 个 内 存 段 。 实 际 
上 ， 这 两 条 指令 的 执行 结果 ， 和 以 下 指令 的 执行 结果 相同 : 


MOV AaxX, Ex 


mov ds,ax 


第 二 ， 栈 在 本 质 上 也 只 是 普通 的 内 存 区 域 ， 之 所 以 要 用 push 和 pop 
指令 来 访问 ， 是 因为 你 把 它 看 成 栈 而 已 。 实 际 上 ， 如 果 你 把 它 看 成 是 普 
通 的 数据 段 而 扎 挥 它 古 一 个 栈 ， 那 么 它 将 不 再 神秘 。 

引入 栈 和 push、pop 指令 只 是 为 了 方便 程序 开发 。 临 时 保存 一 个 数 
值 到 栈 中 ， 使 用 push 指令 是 最 简洁 、 最 省 事 的 ， 但 如 果 你 不 怕 麻 烦 ， 可 
以 不 使 用 它 。 所 以 ， 下 面 的 代码 可 以 用 来 取代 push ax 指令 : 


SU S02 
mov xx SEE 


mov [ss:bxl,ax 
同样 ，pop ax 指令 的 执行 结果 和 下 面 的 代码 相同 : 


mov bx Sp 
mov dx | ss:Dx| 
add sp,2 


你 可 能 还 有 为 一 种 想法 ， 即 ， 我 连 栈 段 部 人 不 用，SP 也 省 了 ， 我 目 己 
把 临时 数据 部 你 存在 数据 段 中 。 好 吧 ， 如 下 是 这 样 的 话 ， 你 必须 在 数据 
段 中 开辟 一 些 空间 ， 并 凶 目 维护 一 个 指针 来 跟踪 这 些 数据 的 存 和 信和 取 
出 。 当 程序 变 得 越 来 越 复 洒 时 ， 这 些 维护 工作 同样 让 你 焦 头 伴 额 。 

因此 ， 显 而 易 见 的 是 ，push 和 pop 指令 更 方便 ， 毕 竟 与 栈 访 问 有 关 
的 一 切 都 站 由 处 理 珍 目 动 维护 的 。 而 且 ， 总 有 一 天 你 会 肥 现 ， 有 些 工 作 
不 使 用 栈 来 进行 的 话 ， 十 非 铝 困难 的 。 


第 三 ， 要 注意 保持 栈 平 衡 。 如 琳 在 做 东 件 事 的 时 候 要 便 用 栈 ， 那 
么 ， 栈 指针 寄存 厅 SP 在 做 这 件 事 之 前 的 值 ， 应 当 和 这 件 事 做 完 后 的 值 相 


同 。 束 是 说 ，push 指令 和 pop 指令 的 数量 应 当 是 相同 的 。 栈 是 反复 使 用 
的 内 存 区 域 ， 如 条 使 用 不 当 ， 将 会 出 现 问题 ， 下 面 束 是 一 个 例子 : 


DeaLt: 
ee ; 其 他 非 栈 操作 的 指令 


pop ax 
loop repeat 


以 上 的 循环 是 干什么 用 的 ， 做 什么 事情 ， 这 个 不 重要 。 因 为 每 次 循 
环 时 ， 虱 要 用 到 寄存 达 AX 和 BX 的 原始 内 容 ， 所 以 ， 循 环 体 的 开头 要 压 
栈 你 人 存 它们 ， 在 循环 体 的 来 尾 要 出 栈 恢复 它们 。 但 是 你 看 到 了 ， 由 于 一 
时 玩忽 ， 只 压 入 了 哥 存 絮 AX， 而 在 出 栈 时 ， 却 多 弹 了 一 个 数值 到 BX 
中 。 在 这 种 情况 下 ， 栈 是 不 平衡 的 ， 程 序 的 运行 结 来 当然 也 不 会 正确 。 


第 四 ， 在 编写 程序 前 ， 必 须 充 分 估计 所 需要 的 栈 空间 ， 以 防止 破坏 
有 用 的 数据 。 特 别 是 在 栈 段 和 其 他 段 属 于 同一 个 段 的 时 候 。 如 图 7-3 所 
示 ， 栈 段 和 代码 段 属于 同一 个 内 存 段 ， 段 地 址 都 是 0x0000， 段 的 长 度 都 
是 64KB。 主 引导 程序 的 长 度 是 512 (0x200) 字 节 ， 从 偏 移 地 址 0x7c00 
延伸 到 0x7e00 。 栈 是 癌 下 增长 的 ， 它 们 之 间 有 0xffff 一 0x7e00 十 1 三 
0x8200 字 贡 的 空 档 。 通 彰 来 说 ， 我 们 的 程序 是 安全 的 ， 因 为 不 可 能 压 入 
这 么 多 的 数据 。 但 是 ， 不 能 掉以轻心 ， 栈 定义 得 过 小 ， 而 且 程 序 编写 不 
当 ， 导 致 栈 破 坏 了 有 用 数据 的 情况 也 时 有 发 生 。 

第 五 ， 尽 管 不 能 完全 阻止 程序 中 的 错误 ， 但 是 ， 通 过 将 栈 定 义 到 一 
个 单独 的 64KB 段 ， 可 以 使 错误 仪 局 限于 栈 ， 而 不 破坏 其 他 上 段 的 有 用 数 
据 。 假 如 栈 的 段 地 址 是 0x0000， 大 小 是 64KB， 那 么 ， 无 论 SP 怎样 变 
化 ， 压 栈 和 出 栈 操作 始终 会 在 该 段 内 进行 ， 而 不 会 影 啊 到 其 他 无 关 的 内 
存 区 域 。 这 样 ， 无 论 任 何 时 候 ， 即 使 是 push 指令 位 于 一 个 无 限 循环 中 ， 
栈 指针 寄存 器 SP 的 内 容 也 永远 只 会 在 0x0000 一 0xFFFF 之 间 来 回 滚动 ， 
不 会 影响 到 其 他 内 存 段 。 

检测 点 7.1 


1. 以 下 指令 执行 后 ， 寄 存 占 AX 中 的 内 容 是 多 少 ? 


mov ax, 0QxEEEO 

and [datal,ax 

Sr ax, [datal 
data db UxD5 0xaa 


2. 下 面 的 说 法 中 哪些 是 正确 的 ? 
A. 8086 处 理 硕 执行 压 栈 操作 时 ， 是 先 将 SP 的 内 容 减 2， 再 访问 栈 


B. 8086 处 理 帮 执行 出 栈 操 作 上 时， 是 先 将 SP 的 内 容 加 2， 骨 访问 栈 


C. 如 果 SP 的 内 容 为 0xFFFC， 则 执行 push ax 后 ，SP 的 内 容 变 为 
UXxFFFA。 

3. 在 衬 白 处 补充 指令 或 指令 的 操作 数 ， 使 得 程序 可 以 把 栈 段 当成 数 
据 段 访问 ， 并 在 寄存 器 DX 中 得 到 AX 的 压 栈 值 。 


DUsh ds ;保护 本 次 操作 之 前 的 DS 
push bx ; 体 护 本 次 操作 之 前 的 BX 
push ax 
mov bxy 

,bx 


mov bX;Sp 


pop ax 
pop bx ;恢复 本 次 操作 之 前 的 BX 
pop ds ;恢复 本 次 操作 之 前 的 DS 


7.6 程序 的 编译 和 运行 
7.6.1 观察 程序 的 运行 结果 
编译 源 程 序 7-1， 然 后 将 生成 的 二 进 制 文件 c07_mbr.bin 写 入 虚拟 便 


熏 的 主 引 导 届 区 ， 局 动 虚 拟 机 观 守 程序 运行 结果 。 如 果 程 序 无 误 ， 续 
应 当 如 图 7-4 所 示 。 





LEARN-ASM [正在 运行 ] - Oracle VM VirtualBox 











消 呈 国信 (WIRight Ctrl 


图 7-4 ”本 章程 序 在 虚拟 机 中 的 运行 结 


7.6.2 在 调试 过 程 中 察看 栈 中 内 容 


很 多 程序 错误 与 栈 的 不 当 使 用 有 关 。 因 此 ， 在 调试 程序 的 过 程 中 ， 
不 可 避免 地 要 察看 栈 的 状态 ， 从 中 发 现 一 些 导 致 程序 出 错 的 蛛丝马迹 。 

在 Bochs 中 察看 栈 的 命令 是 “print-stack”， 它 可 以 带 一 个 参数 ， 用 于 
定 显 示 多 少数 据 。 如 果 不 使 用 参数 ， 则 默认 显示 当前 栈 中 的 16 个 字 。 

如 图 7-5 所 示 ， 当 单 步 执行 了 “push dx" 指令 后 ， 我 们 立即 用 “print- 
stack” 命 令 来 察看 当前 栈 。 当 前 栈 是 由 上 段 寄存 器 SS 指示 的 ， 栈 顶 是 由 栈 
指针 寄存 器 SP 指示 的 。 





Bochs for Windows - Console >= 


| 
(0) [Ox0000000000007c52] 0000:7c52 (unk. ctxt): push dx 
《bochs:3> s 


Next at t:17825551 

(0) [Ox0000000000007c53] 69000:7c53 (unk. ctxt): cmp ax, Ox0000 

80 

M<bochs:4> print-stack 

Stack address size 2 
| 
| STACK QOx10000 [Ox0000] 
| STRCK 0x10002 [9x0000 ] 
| STACK QOx10004 [OQx0000] 
| STACK QOQx10006 [OQx0000] 
| STRCK 0Ox10008 [0Ox0000 ] 
| STACK Qx10060a [0x0000] 
| STACK Qx1000¢ [OQx0000] 
| STRhRCK 0Ox1000e [0Ox0000 ] 
| STRhRCK 6Dx100106 [606x0009 ] 
| STACK Ox10012 [69x906901] 
| STACK QOx10014 [Ox0000] 
| STRhRCK Dx10016 [9x9006 ] 
| STACK QOx10018 [0x00966 ] 
| STACK 9x1001a [GQx0000] 
| STACK 9x1001c [0x00060] 

<bochs:5> 

















图 7-5 ”在 Bochs 中 察看 当前 栈 中 的 数据 


Bochs 并 不 知道 栈 的 实际 大 小 ， 因 此 ， 它 只 是 显示 栈 了 项 〈 由 SP 指 
示 ) 以 下 的 16 个 字 。 如 图 中 所 示 ， 栈 顶 数据 是 0x0030， 其 物理 内 存 地 址 
是 0xFFFE， 这 是 刚 压 入 的 寄存 器 DX 的 内 容 。 


因为 栈 是 从 高 地 址 回 低 地 址 推进 的 ， 因 此 ， 所 请 的 " 栈 顶 以 下 "”， 实 际 
上 指 的 是 高 地 址 方 同 。 因 此 ， 下 一 个 栈 单元 的 物理 内 存 地 址 是 0OxFFFE 加 
2， 即 0x10000。 实 际 上 ， 那 里 并 不 属于 当前 栈 段 ， 当 前 栈 段 的 物理 地 址 
范围 是 0x00000~0x0FFFF， 而 且 实 际 上 我 们 只 使 用 0x07E00~0x0OFFFF 
之 间 的 区 域 ， 但 Bochs 并 不 知道 这 些 。 


7.7 8086 处 理 器 的 寻 址 方式 


处 理 器 的 一 生 ， 是 忙碌 的 一 生 ， 只 要 它 工作 着 ， 就 必定 是 在 取 指 令 
和 执行 指令 。 它 束 像 勒 大 的 牛 ， 吃 的 是 电 ， 撞 出 来 的 还 是 电 ， 不 过 是 为 
一 种 形 却 的 电 。 多 数 指 令 操作 的 是 数值 。 比 如 : 

这 条 指令 执行 时 ， 把 0x55aa 传送 到 寄存 器 AX。 再 如 : 

add dx cx 

这 是 把 寄存 如 DX 中 的 数据 和 寄存 项 CX 中 的 数据 相 加 ， 并 把 结果 你 
留 在 DX 中 ， 同 时 保持 CX 中 原 有 的 内 容 不 变 。 

所 以 ， 如 有 果 你 问 处 理 喜 整 天 忙 什 么 ， 它 一 定 会 说 :“ 还 能 有 什么 ， 束 
是 和 数 打 交 姓 ! ” 

既然 操作 和 处 理 的 是 数值 ， 那 么 ， 必 定 涉 及 数值 从 哪里 来 ， 处 理 后 


送 到 哪里 去 ， 这 称 为 寻 址 方式 (Addressing Mode) 。 简 单 地 说 ， 寻 址 方 
式 束 是 如 何 找 到 要 操作 的 数据 ， 以 及 如 何 找到 存放 操作 结果 的 地 方 。 


实际 上 ， 大 多 数 的 寻 址 方式 我 们 部 已 经 使 用 过 ， 现 在 所 做 的 只 十 一 
个 完整 的 上 总结。 当然 ， 这 里 的 讲解 仅 限 于 16 位 的 处 理 右 。 


7.7.1 寄存 器 寻 址 


最 简单 的 寻 址 方式 是 寄存 器 寻 址 。 就 是 说 ， 指 令 执 行 时 ， 操 作 的 数 
位 于 寄存 项 中 ， 可 以 从 寄存 左 里 取得 。 这 种 寻 扯 方式 的 例子 还 是 很 多 
的 ， 比如 : 


mGOY 训 光 ,已 文 
add bx 0xf000 


nee > 


以 上 上， 第 一 条 指令 的 两 个 操作 数 都 是 寄存 硒 ， 是 典型 的 寄存 规 寻 
址 ; 第 二 条 指令 的 目的 操作 数 是 寄存 融 ， 因 此 ， 该 操作 数 也 是 寄存 硕 寻 


址 ， 第 三 条 指令 就 更 不 用 说 了 。 
7.7.2 ”立即 寻 址 


了 亦 即 寻 址 又 叫 立 即 数 寻 址 。 也 束 是 说 ， 指 令 的 操作 数 是 一 个 立即 
数 。 比 如 : 


add bx,O0xf000 


mov dX,label & 


以 上 ， 第 一 条 指令 的 目的 操作 数 采用 了 寄存 器 寻 址 方式 ， 用 于 提供 
被 加 数 ， 第 二 个 操作 数 〈 源 操作 数 ) 用 于 给 出 加 数 0xf000。 这 是 一 个 直 
接 给 出 的 数值 ， 是 立即 在 指令 中 给 出 的 ， 最 终 参与 加 法 运算 的 就 是 它 ， 
不 需要 通过 其 他 方式 寻找 ， 故 称 为 立即 数 。 这 也 是 一 种 寻 址 方式 ， 称 为 
立即 寻 址 。 

在 第 二 条 指令 中 ， 目 的 操作 数 也 采用 的 是 寄存 器 寻 址 方式 。 尽 管 源 
操作 数 是 一 个 标号 ， 但 是 ， 标 号 是 数值 的 等 价 形式 ， 代 表 了 它 所 在 位 置 
的 汇编 地 址 。 因 此 ， 在 编译 阶段 ， 它 会 被 转化 为 一 个 立即 数 。 因 此 ， 该 
指令 的 源 操作 数 也 采用 了 立即 寻 址 方式 。 


7.7.3 内存 寻 址 


寄存 左 寻 址 的 操作 数位 于 寄存 右 中 ， 芯 即 寻 址 的 操作 数位 于 指令 
中 ， 是 指令 的 一 部 分 。 传 统 上 ， 这 是 两 种 速度 较 快 的 寻 址 方式 。 但 是 ， 
它们 也 有 局 限 性 。 一 方面 ， 我 们 不 可 能 总 是 知道 要 操作 的 数 是 多 少 ， 因 
此 也 就 不 可 能 总 是 在 指令 中 使 用 立即 数 ， 另 一 方面 ， 寄存器 的 数量 有 
限 ， 不 可 能 总 指望 在 宫 存 内 之 回 米 回 倒 腾 。 

考虑 到 内 存 容 量 巨大 ， 上 所以， 在 指令 中 使 用 内 存 地 址 ， 来 操作 内 存 
中 的 数据 ， 是 最 理想 不 过 了 。 正 是 因为 内 存 访 问 如 此 重要 ， 处 理 需 才 拥 
有 好 几 种 内 存 寻 址 方式 。 

我 们 知道 ，8086 处 理 絮 访问 内 存 时 ， 采 用 的 是 段 地 址 左 移 4 位 ， 然 
后 加 上 偏 移 地 址 ， 来 形成 20 位 物理 地 址 的 模式 ， 段 地 址 由 4 个 段 寄存 器 
之 一 来 提供 ， 偏 移 地 址 要 由 指令 来 提供 。 


因此 ， 上 所 谓 的 内 存 寻 址 ， 实 际 上 束 是 寻找 偶 移 地 址 ， 这 称 为 有 效 地 
址 (Effective Address，EA) 。 换 名 话说 ， 束 是 如 何在 指令 中 提供 仿 移 
地 址 ， 供 处 理 器 访问 内 存 时 使 用 。 


1. 直接 寻 址 


使 用 该 寻 址 方式 的 操作 数 古 一 个 仿 移 地 址 ， 而 且 给 出 了 该 仿 移 地 址 
的 具体 数值 。 比 如 : 


mey ax | xcof | 
add word 10x02201 0xs6000 
xorpbyte les:label bl O00 


但 几 是 表示 内 存 地 址 的 ， 都 必须 用 中 括号 括 起 来 。 

以 上 ， 在 第 一 条 指令 中 ， 源 操作 数 使 用 的 是 直接 寻 址 方式 ， 当 这 条 
指令 执行 时 ， 人 处理 器 将 数据 段 寄 存 器 DS 的 内 容 左 移 4 位 ， 加 上 这 里 的 
0x5c0f， 形 成 20 位 物理 地 址 。 接 着 ， 从 该 物理 地 址 处 取得 一 个 字 ， 传 送 
到 寄存 器 AX 中 。 

在 第 二 条 指令 中 ， 目 的 操作 数 采 用 的 是 直接 寻 址 方式 。 当 这 条 指令 
执行 时 ， 处 理 嚣 用 同样 的 方法 ， 访 问 由 段 寄 存 器 DS 指 问 的 数据 段 ， 并 把 
指令 中 的 立即 数 加 到 该 段 中 偏 移 地 址 为 0x0230 的 字 单 元 里 。 

尽 党 在 第 三 条 指令 中 ， 目 的 操作 数 使 用 了 标志 和 段 超越 前 级， 但 它 
依然 属于 直接 寻 址 方式 。 原 因 很 简单 ， 标 亏 是 数值 的 等 价 形 式 ， 在 指令 
编译 阶段 ， 会 被 转换 成 数值 ;而 段 超越 前 绥 仅 仅 用 来 改变 默认 的 数据 
段 。 

2. 基 址 寻 址 

很 多 时 候 ， 我 们 会 有 一 大 堆 的 数据 要 人 处理， 而 且 它 们 通常 都 古 挨 在 
一 起 ， 顺 序 存放 的 。 比 如 : 


puffer dw Ox20,0x100 .0x0£ -0x300, 0xf££00 


假如 要 将 这 些 数据 统统 加 一 ， 那 么 ， 使 用 和 耳 接 寻 址 的 指令 序列 肯定 
征 这 样 的 : 


inc word [bufferl]| 
ine word [BUffer$2] 


inc word [buffer+4] 


这 样 做 好 吗 ? 当然 ， 程 序 本 身 征 没有 问题 的 。 但 是 ， 考 谍 到 它 的 效 
率 和 代 人 担 的 徐 浅 性 ， 特 别 是 这 些 工 作用 循环 来 完成 会 更 好 ， 可 以 使 用 基 
址 寻 址 。 所 谓 基 址 寻 址 ， 束 是 在 指令 的 地 址 部 分 使 用 基 址 寄 仔 蕉 BX 或 者 
BP 来 提供 偏 移 地 址 。 比 如 : 


mow [5x| ,dx 


add byte [px xs 


以 上 ， 第 一 条 指令 中 的 目的 操作 数 采 用 了 基 址 寻 址 。 在 指令 执行 
时 ， 处 理 硕 将 数据 段 寄 存 需 DS 的 内 容 左 移 4 位 ， 加 上 基 址 寄存 如 BX 中 
的 内 容 ， 形 成 20 位 的 物理 地 址 。 然 后 ， 把 寄存 硕 DX 中 的 内 容 传达 到 该 地 
址 处 的 字 单 元 里 。 


第 二 条 指令 中 的 目的 操作 数 也 采用 的 是 基 址 寻 址 。 指 令 执行 时 ， 将 
数据 段 寄 存 右 DS 的 内 容 左 移 4 位 ， 加 上 和 寄存 禹 BX 中 的 内 容 ， 形 成 20 位 
的 物理 地 址 。 然 后 ， 将 指令 中 的 立即 数 0x55 加 到 该 地 址 处 的 字 节 单元 


使 用 基 址 寻 址 可 以 使 代码 变 得 简洁 高 效 。 比 如 ， 可 以 用 以 下 的 代码 
来 处 理 上 面 的 批量 加 一 任务 : 


mov bx,buffer 

GOV Cx 4 
IDINnec: 

Ine WOoOrd LBX| 

ada Bx 2 

Too Tpine 


其 址 寻 址 的 寄存 右 也 可 以 是 BP。 比 如 : 
mov AX, [S58] 


这 条 指令 的 源 操作 数 采 用 了 基 址 寻 址 方式 。 但 是 ， 与 前 面 的 指令 相 
比 ， 它 稍微 有 有些 特 殊 。 原 因 在 于 ， 它 及 用 十 其 址 寄存 如 BP， 在 形成 20 位 


的 物理 地 址 时 ， 默 认 的 段 寄 存 器 是 SS。 也 就 是 说 ， 它 经 常用 于 访问 栈 。 
这 条 指令 执行 时 ， 处 理 器 将 栈 段 寄存 器 SS 的 内 容 左 移 4 位 ， 加 上 寄存 需 
BP 的 内 容 ， 形 成 20 位 的 物理 地 址 ， 并 将 该 地 址 处 的 一 个 字 传 送 到 寄存 
器 AX 中 。 

我 们 知道 ， 栈 是 后 进 先 出 的 数据 结构 ， 访 问 栈 的 一 般 方法 是 使 用 
push 和 pop 指令 。 比 如 我 们 用 以 下 的 指令 压 入 两 个 数据 : 


meow ax 0X3000 
push ax 
mow ax: 0x000 


push ax 


很 显然 ， 如 果 要 用 pop 指令 弹出 数据 ， 束 必须 先 弹出 0x7000， 才 能 
弹出 0x5000， 除 非 你 改变 了 栈 指 针 SP 的 内 容 ， 和 否则 这 个 顺序 是 不 可 能 
改变 的 。 

但 是 ， 有 时候 我 们 希望 ， 而 且 必 须 得 越过 这 种 限制 ， 去 访问 栈 中 的 
内 容 ， 还 不 能 破坏 栈 的 状态 ， 特 别 是 栈 指 针 寄 存 器 SP 的 内 容 ， 使 得 push 
和 pop 操作 能 正常 进行 。 一 个 典型 的 例子 是 高 级 语言 里 的 函数 调用 ， 所 
有 的 参数 都 位 于 栈 中 。 为 了 能 访问 到 那些 被 压 在 栈 底 的 参数 ， 这 时 ，BP 
就 能 派 上 用 场 : 


Mmeov ax, OxX5000 
PuUsh a 

mov bp,sp 
mov Bax 0xi000 
push ax 


mov dx, [bp] ;dx 中 的 内 容 为 0x5000 


以 上 ， 在 压 入 0x5000 之 后 ， 立 即将 栈 指 针 SP 保存 到 BP。 后 面 ， 尽 
管 栈 顶 的 数据 0x7000 没有 出 栈 ， 但 依然 可 以 用 BP 取出 压 在 栈 下 面 的 
0x5000。 如 此 一 来 ， 正 常 的 push 和 pop 操作 照样 进行 ， 同 时 ， 还 能 访问 
到 栈 中 的 参数 。 

基 址 寻 址 允许 在 基 址 寄存 器 的 基础 上 使 用 一 个 偏 移 量 。 有 了 时候， 这 
使 得 它 更 加 灵活 。 比 如 : 


me Co 


处 理 器 在 执行 时 ， 将 段 寄 存 器 SS 的 内 容 左 移 4 位 ， 加 上 BP 的 内 
容 ， 再 减 去 偶 移 量 2 以 形成 物理 地 址 。 这 样 一 来 ， 在 保持 基 址 寄存 器 BP 
内 容 不 变 的 情况 下 ， 束 可 以 访问 栈 中 的 任何 元 系 。 这 里 ， 仿 移 量 仪 用 于 
在 指令 执行 时 形成 有 效 地 址 ， 不 会 改变 寄存 器 BP 的 原 有 内 容 。 


这 种 增加 偏 移 量 的 做 法 也 适用 于 基 址 寄存 器 BX。 以 下 代码 是 前 面 那 
个 批量 加 一 任务 的 新 版 本 : 


XoOr Sx Bx 
mov CG, 4 
oTriG. 
inc word [bx+bufferl| 
add BX,2 
losp, loanec 


以 上 代码 和 前 一 个 版 本 相 比 ， 没 有 太 大 变化 ， 区 别 仅仅 在 于 ，BX 现 
在 是 从 0 开始 违 增 的 ，inc 指令 操作 数 的 仿 移 地 址 由 BX 和 标号 buffer 所 代 
表 的 值 相 加 得 到 。 相 加 拧 作 在 指令 执行 时 进行 ， 仅 用 于 形成 有 效 俩 移 地 
址 ， 不 会 影响 到 BX 寄存 器 的 内 容 。 

3. 变 址 寻 址 


变 址 寻 址 类 似 于 基 址 寻 址 ， 唯 一 不 同 之 处 在 于 这 种 寻 址 方式 使 用 的 
是 变 址 寄存 器 〈 或 称 索 引 寄存 器 ) SI 和 DI。 例 如; 


mov [Ss1]| .dx 
dc ax [dlrl 


XOoOr Word [5 0x8000 


和 基 址 寻 址 一 样 ， 当 带 有 这 种 操作 数 的 指令 执行 时 ， 除 非 使 用 了 段 
超越 前 级 ， 处 理 器 会 访问 由 段 寄存 器 DS 指向 的 数据 段 ， 偏 移 地 址 由 寄存 
器 S| 或 者 DI 提供 。 


同样 地 ， 变 址 寻 址 方式 也 允许 市 一 个 侦 移 量 : 


mo sf+foOx1001 
and byte lditlabel al. 0x80 


以 上 第 二 条 指令 中 ， 尽 管 使 用 的 是 标号 ， 但 本 质 上 属于 一 个 编 详 阶 
段 确 定 的 数值 。 


4. 基 址 变 址 寻 址 
让 处 理 絮 文 持 多 种 寻 址 方式 会 增加 人 硬件 上 的 复 条 性 ， 但 可 以 增强 它 
的 数据 处 理 能 力 ， 这 么 做 是 值得 的 。 说 到 数据 人 处理， 下 面 是 一 个 稍微 复 


string db ‘abcdefghijklmnopqrstuvwxyz’ 


以 上 声明 了 标号 "string "并 初始 化 了 26 个 字 市 的 数据 。 现 在 ， 你 的 任 
务 是 ， 将 这 26 字 节 的 数据 在 原 地 反问 排列 。 

这 个 问题 不 难 ， 所 以 你 可 能 很 快 想到 使 用 栈 ， 先 将 这 26 个 数据 压 
栈 ， 冉 反问 出 栈 ， 因 为 栈 是 后 进 完 出 的 ， 正 好 得 合 要 求 。 代 人 码 是 这 样 的 
(代码 段 、 栈 段 初始 化 的 代码 统统 第 上 略 〉: 


moV Cx,26 :循环 次 数 ， 从 26 到 1， 共 26 次 
MOY bX String ;数据 区 首 地 址 (基地 址 ) 
Jopush: 


me aa [BX| 


push ax 
ine bx 
loop lppush ; 循环 压 栈 


MO GX 26 


mov bx, String 


JDDOD: 
pop ax 
mov [bxl,al 
ine Dx 
loopB LBBop ; 循环 出 栈 


这 的 确 是 个 好 办 法 。 不 过 ，8086 处 理 器 也 支持 一 种 基 址 加 变 址 的 寻 
址 方式 ， 简 称 基 址 变 址 寻 址 ， 可 能 用 起 来 更 方便 。 

使 用 基 址 变 址 的 操作 数 可 以 使 用 一 个 基 址 寄存 如 (BX 或 者 BP) ， 
外 加 一 个 变 址 寄存 器 (SI 或 者 Dl) 。 它 的 基本 形式 是 这 样 的 : 


mow a | BT3l| 


ao worad [Ztal|, 0X3000 


以 上 ， 第 一 条 指令 的 源 操 作 数 采用 了 基 址 变 址 寻 址 。 当 处 理 融 执行 
这 条 指令 时 ， 把 数据 段 寄存 带 DS 的 内 容 左 移 4 位 ， 加 上 基 址 寄存 兹 BX 
的 内 容 ， 再 加 上 变 址 寄存 天 SI 的 内 容 ， 共 同形 成 20 位 的 物理 地 址 。 然 
后 ， 从 该 地 址 处 取得 一 个 字 ， 传 送 到 寄存 大 AX 中 。 

第 二 条 指令 与 第 一 条 指令 类 似 ， 只 不 过 是 加 法 指令 ， 它 的 目的 操作 
数 采 用 了 基 址 变 址 寻 址 ， 源 操作 数 采 用 的 是 立即 寻 址 。 这 条 指令 执行 
时 ， 处 理 帮 访问 由 段 寄 和 存 桌 DS 指 癌 的 数据 段 ， 加 上 由 BX 和 DI 相 加 形成 
的 偏 移 地 址 ， 共 同形 成 20 位 的 物理 地 址 ， 然 后 将 立即 数 0x3000 加 到 该 
地 址 处 的 字 单 元 里 。 


采用 基 址 变 址 寻 址 方式 的 排序 代码 如 下 : 


moOw bX StrAng :数据 区 首 地 址 

movy S10 ; 正 问 索引 

mewx di 25 反 交 罕 引 
order: 


moOv aah, [bX+Ssi) 

mov al, [bx+d1] 

moY [B+tS1|, Al 

mov [bx+dqi] ,ah ; 以 上 4 行 用 于 交换 首尾 数据 
1ng S31 

dec di 

ED SL di 


jl1 order ;首尾 没有 相遇 ， 或 者 没有 超越 ， 继 续 
和 前 面 使 用 栈 的 代码 相 比 ， 指 令 的 数量 没有 明 时 减少， 这 说 明 任务 
还 不 够 复杂 ， 也 许 只 能 这 么 解释 了 。 但 是 ， 它 同样 很 方便 ， 很 有 效 ， 不 
和 十 吗 ? 
同样 地 ， 基 址 变 址 寻 址 允许 在 基 址 寄存 器 和 变 址 寄存 右 的 基础 上 帝 
一 个 仿 移 量 。 比如 : 


mo [bx+sii+0x100|],al 
and byte [bxtditlabel al.0x80 


本 章 习 题 


1. 修改 代码 清单 7-1 的 第 31 一 37 行 ， 使 用 loop 指令 来 计算 累加 
和 。 要 求 : CX 寄存 右 既 用 来 控制 循环 次 数 ， 同 时 还 用 来 作为 被 坚 加 的 
数 。 

2. 在 16 位 的 处 理 嚣 上， 做 加 法 的 指令 是 add， 但 它 每 次 只 能 做 8 位 
或 16 位 的 加 法 。 际 此 之 外 ， 还 有 一 个 禹 进位 加 法 指令 adc (Add With 
Carry) ， 它 有 的 指令 格式 和 add 一 样 ， 目 的 操作 数 可 以 是 8 位 或 16 位 的 通 
用 寄存 研 和 内 存单 元 ， 源 操作 数 可 以 是 与 目的 操作 数 宽 虚 一 致 的 通用 寄 
存 郝 、 内 存单 元 和 立即 数 〈 但 目的 操作 数 和 源 操 作 数 同 为 内 存单 元 的 除 
外 ) 。 不 过 ，adc 指令 在 执行 的 时 候 ， 除 了 将 目的 操作 数 和 源 操 作 数 相 
加 ， 还 要 加 上 当前 标志 寄存 器 的 CF 位 。 也 就 是 说 ， 视 CF 位 的 状态 ， 还 
要 再 加 0 或 者 加 1。 这 样 一 来 ， 用 adc 指令 配合 add 指令 ， 就 可 以 计算 16 
位 以 上 的 加 法 。 

adc 指令 对 OF、SF、ZF、AF、CF 和 PF 的 影响 视 计算 结果 而 定 。 


现在 ， 请 编 与 一 段 主 引 导 刷 区 程序 ， 计 算 1 到 1000 的 累加 和 和， 并 在 
屏 医 上 电 示 结 末 。 


第 8 章 ”硬盘 和 显卡 的 访问 与 控制 


忌 是 把 目光 放 在 一 个 小 小 的 主 引 导 必 区 上 ， 这 没什么 意思 。 现 在 ， 
是 我 们 离开 它 ， 同 目 由 天 地 迈进 的 时 候 了 。 但 是 ， 应 该 罗 癌 哪里 呢 ? 


主 引 导 虱 区 是 处 理 需 迈 同 广阔 天 地 的 第 一 芯 跳 板 。 离 开 主 引导 局 区 
之 后 ， 前 方 通 香 束 是 操作 系统 的 条 本， 也 吏 是 我 们 经 昔 听 说 的 DOS、 
Windows、Linux、UNIX 等 。 

操作 系统 也 是 由 一 大 堆 指 令 组 成 的 ， 之 所 以 将 其 比 作 " 和 森林 "， 生 因为 
它 包 含 了 更 多 的 指令 ， 也 许 是 儿 万 条 、 几 十 万 条 ， 其 至 几 千 万 条 的 指 
令 。 相 比 之 下 ， 我 们 在 前 面 编号 的 那些 指令 代码 则 相形 见 纳 了 。 


和 主 引 叶 刷 区 程序 一 样 ， 操 作 系 统 也 位 于 便 盘 上。 操作 系统 是 需要 
安 儿 到 便 盘 上 的 ， 这 个 安 朗 过程 不 但 要 把 操作 系统 的 指令 和 数据 写 入 便 
人 熏 ， 通 种 还 要 更 新 主 引导 忆 区 的 内 容 ， 好 让 这 块 跳板 下 接连 看 操作 系 
统 。 不 像 我 们 ， 一 二 用 主 引 导 书 区 来 显示 字符 和 做 加 法 。 


操作 系统 通常 肩负 着 处 理 器 管理 、 内 存 分 配 、 程 序 加 载 、 进 程 〈 即 
己 经 位 于 内 存 中 的 程序 ) 调度 、 外 围 设 备 〈 显 卡 、 硬 盘 、 声 卡 等 ) 的 控 
制 和 管理 等 任务 。 举 个 例子 来 说 ， 你 每 天 都 要 使 用 的 Windows， 它 可 以 
让 你 看 到 计算 机 内 都 有 几 据 硬盘， 都 安装 了 哪些 程序 〈 通 过 图 标 来 显 
示 ) ， 并 人 允许 你 双击 图 标 运行 这 些 程 序 ， 这 都 是 托 了 操作 系统 
(Windows) 的 福 。 要 不 然 的 话 ， 这 都 是 不 可 能 的 事 。 


拖 个 人 之 力 ， 与 一 个 非常 完善 的 操作 系统 ， 这 几乎 是 不 可 能 的 事 。 
但 是 ， 写 个 小 程序 ， 模 拟 一 下 它 的 东 个 功能 ， 还 是 可 以 的 。 我 们 知道 ， 
编译 好 有 的 程序 通 第 部 存放 在 像 价 盘 这 样 的 载体 上 ， 需 要 加 载 到 内 存 之 后 
才能 执行 。 这 个 过 程 并 不 简单 ， 首 先 要 读 取 便 盘 ， 然 后 决定 把 它 加 载 到 
由 存 的 什么 位 置 。 最 重要 的 是 ， 程 序 通 币 和 是 分 段 的 ， 载 入 内 人 存 之 后 ， 还 
要 重新 计算 段 地 址 ， 这 叫做 段 的 重 定位 。 


程序 可 以 有 千 千 万 万 个 ， 但 加 载 过 程 却 古 固定 的 。 在 本 章 ， 我 们 把 
主 引 导 刷 区 改造 成 一 个 程序 加 载 融 ， 或 痢 说 是 一 个 加 载 程序 ， 它 的 功能 
征 加 载 用 户 程 序 ， 并 执行 该 程序 《将 处 理 玲 的 控制 权 交 给 该 程序 ) 。 忆 
的 交 来， 本章 的 目标 十: 


1. 柑 拟 操作 系统 加 载 应 用 程序 的 过 程 ， 汇 示 段 的 重 定 位 方法 ， 最 终 
使 你 彻 原理 解 8086 处 理 禹 的 分 段 内 存 管理 机 制 。 


2. 学 习 X86 处 理 硕 过 程 调用 的 程序 执行 机 制 |。 


3. 以 谈 便 盘面 区 和 控制 屏 戎 光标 为 实例 ， 了 解 X86 处 理 柴 访问 外 围 
使 件 设 备 的 方法 。 


4. 总 结 JMP 和 CALL 指令 的 全 部 格式 。 


5. 认识 更 多 的 x86 处 理 器 指令 ， 如 in、out、shl、shr、rol、ror、 
jmp、call、ret 等 。 


8.1 本 章 代 码 清单 





8.2 用户 程 序 的 结构 


8.2.1 分 段 、 段 的 汇编 地 址 和 段 内 汇编 地 址 


处 理 融 的 工作 模 却 是 将 和 内存 分 成 馆 辑 上 的 段 ， 指 令 的 获取 和 数据 的 
访问 一 健 按 “ 段 地 址 : 伺 移 地 址 "的 方式 进行 。 相 对 应 地 ， 一 个 规范 的 程 
序 ， 应 当 包 括 代 人 码 段 、 数 据 段 、 附 加 段 和 栈 段 。 这 样 一 来 ， 段 的 划分 和 
段 与 段 之 间 的 界限 在 程序 加 载 到 内 存 之 前 束 已 经 准备 好 了 了。 


和 我 们 以 前 编写 的 源 程 序 不 同 ， 代 码 清 单 8-2 很 长 。 当 然 ， 真 正 的 不 
同 之 处 在 于 ， 代 码 和 数据 是 以 段 的 形式 组 织 的 。 当 然 ， 因 为 清单 很 长 ， 
看 起 来 并 不 是 非常 明显 。 为 了 清楚 起 见 ， 图 8-1 给 出 了 整个 源 程序 的 组 织 
结构 。 

NASM 编译 器 使 用 汇编 指令 “SECTION” 或 者 “SEGMENT”* 来 定义 
段 。 它 的 一 般 格式 是 


SECTION 段 名 称 
或 者 
SEGMENT 段 名 称 


每 个 段 都 要 求 给 出 名 字 ， 这 就 是 段 名 称 ， 它 主要 用 来 引用 一 个 段 ， 
可 以 是 任意 名 字 ， 只 要 它们 彼此 之 间 不 会 重复 和 混 消 。 

NASM 编译 塔 不 关心 段 的 用 途 ， 可 能 也 根本 不 知道 段 的 用 途 ， 不 知 
道 它 是 数据 段 ， 还 是 代码 段 ， 或 是 栈 段 。 事 实 上 ， 这 都 不 重要 ， 段 只 用 
来 分 隔 程序 中 的 不 同 内 容 。 

不 过 ， 话 义 说 回来 了 了 ， 作 为 程序 员 ， 每 个 段 的 用 途 ， 你 目 己 是 清楚 
的 。 所 以 ， 为 每 个 段 起 一 个 直观 好 记 的 名 字 ， 那 是 应 该 的 。 如 图 8-1 所 
示 ， 第 一 个 段 的 名 字 是 "header， 表 明 它 是 整个 程序 的 开头 部 分 ， 第 二 个 
段 的 名 字 是 “code"”， 表 明 这 是 代码 段 ; 第 三 个 段 的 名 字 是 "data"， 表 明 这 
是 数据 段 。 


比较 重要 的 是 ， 一 旦 定义 段 ， 那 么 ， 后 面 的 内 容 就 都 属于 该 段 ， 除 
非 义 出 现 了 男 一 个 段 的 定义 。 男 外 ， 如 图 8-2 所 示 ， 有 时 候 ， 程 序 并 不 以 
段 定义 语句 开始 。 在 这 种 情况 下 ， 这 些 内 容 默 认 地 自 成 一 个 段 。 最 为 典 
型 的 情况 是 ， 上 整个 程序 中 都 没有 有 段 定义 语句 。 这 时 ， 整 个 程序 上 自 成 一 个 
人 

NASM 对 段 的 数量 没有 限制 。 一 些 大 的 程序 ， 可 能 拥有 不 止 一 个 代 
人 码 段 和 数据 段 。 


Intel 处 理 融 要 求 段 在 内 存 中 的 起 始 物理 地 址 起 码 是 16 字 市 对 齐 的 。 
这 人 句 话 的 意思 和 是 ， 必 须 是 16 的 倍数 ， 或 者 说 该 物理 地 址 必须 能 被 16 整 


综 。 


相应 地 ， 汇 编 语言 源 程序 中 定义 的 各 个 段 ， 也 有 对 齐 方面 的 要 求 。 
具体 做 法 是 ， 在 段 定 义 中 使 用 “align=” 子 句 ， 用 于 指定 某 个 SECTION 的 
汇编 地 址 对 齐 方式 。 比 如 说 ，“align=16” 就 表示 上 段 是 16 字 节 对 齐 的 ， 
“align=32” 束 表示 上 段 是 32 字 节 对 齐 的 。 





section.header.start 


section.code.start 











program_end 


图 8-1 用 户 程 序 的 一 般 结构 


833 Asm Editor-2011-11 一 | SE 属 论 : 
文件 (F) 选项 (QO) 说 明 (H) 





mov ax,cs 
mov dS5,ax 





jmp 
da 
后 面 | 从 者 从 所 
uml db Ox55 
strl1 db hello,world 
str2 db 'This chapter 





图 8-2 程序 并 非 以 段 定义 开始 的 情况 


在 产程 序 编 译 阶 段 ， 编 译 鼎 将 根据 align 子 句 确 定 段 的 起 始 汇 编 地 
址 。 如 图 8-3 所 示 ， 这 里 定义 了 三 个 段 ， 分 别 是 data1、data2 和 data3， 
每 个 段 里 只 有 一 个 字 节 的 数据 ， 分 别 是 0x55、 0xaa 和 0x99。 


333 Asm Editor-2011-11 [E:\IA32ASM\booktool\exam.asm] 
文件 (F) 选项 (QO) 说 明 (H) 

1 section datal align=16€ 

2 db Ox55 


编译 完成 : 
EMA32ASM\booktoohexam.asm 一 > EMA32ASNM\booktool\exam.bin 








图 8-3 align 子 句 对 上段 的 影响 ( 编 详 之 前 的 源 代码) 


理论 上 ， 如 果 不 考 虑 段 的 对 齐 方式 ， 那 么 段 data1 的 汇编 地 址 是 0， 
段 data2 的 汇编 地 址 是 1， 段 data3 的 汇编 地 址 是 2。 


但 是 ， 在 这 里 ， 每 个 段 的 定义 中 都 包含 了 要 求 16 字 节 对 齐 的 子 句 ， 
情况 便 不 同 了 。 如 图 8-4 所 示 ， 这 是 编译 后 的 结果 ， 因 为 在 段 data1 之 前 
没有 任何 内 容 ， 故 段 data1 的 起 始 汇 编 地 址 是 0 (在 图 中 是 
0x00000000) ， 而 且 地 址 0 本 喘 束 是 16 字 布 对 齐 的 ， 符 合 align 子 句 的 

段 的 汇编 地 址 其 实 束 古 段 内 第 一 个 元 系 〈 数 据 、 指 令 ) 的 汇编 地 
址 。 因 此 ， 在 段 data1 中 声明 和 初始 化 的 0x55 位 于 汇编 地 址 0x00000000 
bs 


段 data2 也 要 求 是 16 字 节 对 齐 的 。 问 题 是 ， 从 汇编 地 址 0x00000001 
开始 ， 只 有 0x00000010“〈 十 进 制 的 16) 才能 被 16 整除 。 于 是 ， 编 译 器 
将 0x00000010 作为 段 data2 的 汇编 地 址 ， 并 在 两 个 段 之 间 填 充 15 字 节 
的 0x00〈 段 data1 只 有 1 字 节 的 长 度 ) 。 


段 data3 的 处 理 与 前 面 两 个 段 相 同 。 因 为 段 data2 只 有 1 字 节 ， 故 也 
需要 在 它们 之 间 填 充 15 字 节 。 这 样 ， 段 data3 的 汇编 地 址 束 是 
0x00000020“〔〈 十 进 制 的 32) 。 段 data3 也 只 有 1 字 节 (0x99) ， 所 以 ， 
汇编 地 址 0x00000020 处 是 0x99， 这 也 是 编译 结果 中 的 最 后 一 字 节 。 





228 HexViewer-2011-11 [ENA32ASM\booktool\exam.bin] = XxX 
文件 (E) 
loo000000 


i00000020 99 











图 8-4 ”align 子 句 对 段 的 影响 〈 编 诺 之 后 的 二 进 制 文件 ) 


正如 我 们 刚刚 讨论 过 的 ， 每 个 段 部 有 一 个 汇编 地 址 ， 它 是 相对 于 整 
个 程序 开头 〈0) 的 。 为 了 方便 取得 该 段 的 汇编 地 址 ，NASM 编 详 问 提供 
了 以 下 的 表达 式 ， 可 以 用 在 你 的 程序 中 : 


section .上 段 名 称 . start 


如 图 8-1 所 示 ， 段 "heade 相 对 于 整个 程序 开头 的 汇编 地 址 是 
section.headerstart ， 段 “code" 相对 于 整个 程序 开头 的 汇编 地 址 是 
section.code.start。 在 这 个 例子 中 ， 因 为 段 5header 是 在 程序 的 一 开始 定 
义 的 ， 它 的 前 面 没有 其 他 内 容 ， 故 section.header.start=0。 


如 图 8-1 所 示 ， 段 定义 语句 还 可 以 包含 wstart=" 子 句 。 尽 管 定义 了 
段 ， 但 是 ， 引 用 茶 个 标号 时 ， 广 标号 处 的 汇编 地 址 依然 是 从 整个 程序 的 
开头 计算 的 ， 而 不 是 从 段 的 开头 处 计算 的 。 

这 就 很 碎 烦 (有 时 候 也 很 用) 。 因 此 ，vstart 可 以 解决 这 个 问题 。 
如 图 8-1 所 示 , “putch" 是 段 code 中 的 一 个 标号 ， 原则 上 ， 该 标号 代表 有 的 
汇编 地 址 应 诅 从 程序 开头 计算 。 但 是 ， 因 为 段 code 的 定义 中 有 ”vstart=0” 


子 句 ， 所 以 ， 标 号 “putch” 的 汇编 地 址 要 从 它 所 在 段 的 开头 计算 ， 而且 从 0 
开始 计算 。 

如 图 8-1 所 示 ， 同 样 的 情形 也 出 现在 段 data 中 。 段 data 的 定义 中 也 
有 "vstart=0" 子 句 ， 因 此 ， 当 我 们 在 段 code 中 引用 段 data 中 的 标号 
“string "时 〈mov ax,string) ， 尽 管 在 几 中 没有 标明 ， 标 号 “String "所 代表 
的 汇编 地 址 是 相对 于 其 所 在 段 dqata 的 。 也 就 是 说 ， 传 送 到 寄存 器 AX 中 的 
数值 是 标号 String 相对 于 段 data 起 始 处 的 长 度 。 


但 和 是， 图 中 了 最 后 一 个 段 trail 的 定义 中 没有 包含 vstart=0" 子 名。 那 融 
对 不 起 了 ， 该 段 内 有 一 个 标号 “program_end”， 它 的 汇编 地 址 就 要 从 整个 
程序 开头 计算 。 因 为 它 是 整个 程序 中 的 最 后 一 行 ， 从 这 个 意义 上 来 说 ， 
它 所 代表 的 汇编 地 址 束 是 整个 程序 的 大 小 《以 字 节 计 ) 。 

检测 点 8.1 

对 于 以 下 程序 片断 ， 假 如 section.data1.start=0x60， 则 : 

1. section.data2.start= ( ) 
section.data3.start= ( ) 
执行 mov ax,lba 指令 后 ， 寄 存 器 AX 中 的 内 容 是 多 
执行 mov ax,lbc 指令 后 ， 寄 存 需 AX 中 的 内 容 是 多 少 ? 

是 多 


执行 mov ax,lbd 指令 后 ， 寄 存 器 AX 中 的 内 容 


Ol 上 QQ ND 


We ; 其 他 指令 
section datal align=16 vstart=0 
Iba. Gb Ox55, 0Xf0 
section data2 align=16 vstart=0 
lbb db 0x00, 0x90 
Lbe Aw OXF000 
section data3 align=16 


Bd aw dxrfitf0 Dxftfie 


8.2.2 用户 程序 头 部 


在 上 面 ， 我 们 已 经 知道 如 何在 用 户 程序 中 分 段 ， 也 知 基 各 种 段 定 义 
子 句 对 段 的 起 始 汇 编 地 址 和 段 内 汇编 地 址 的 影响 。 现 在 ， 让 我 们 结合 
革 中 的 实例 来 进一步 加 深 认 识 。 


浏览 一 下 本 章 代 码 清 单 8-2， 你 会 发 现 ， 本 章 的 用 户 程序 实际 上 定义 
了 7 个 段 ， 分 别 是 第 7 行 定义 的 段 header、 第 27 行 定 义 的 段 code 1、 第 
163 行 定 义 的 段 code_ 2、 第 173 行 定 义 的 段 data_1、 第 194 行 定 义 的 段 
data 2、 第 201 行 定 义 的 段 stack 和 第 208 行 定 义 的 段 trail。 

一 般 来 说 ， 加 载 右 和 用 户 程序 是 在 不 同 的 时 间 、 不 同 的 地 方 ， 由 不 
同 的 人 或 公司 开发 的 。 这 就 意味 着 ， 它 们 彼此 并 不 了 解 对 方 的 结构 和 功 
能 。 事 实 上 ， 也 不 需要 了 解 。 

如 图 8-5 所 示 ， 它 们 彼此 看 对 方 都 是 一 个 黑人 合子， 并 不 了 解 对 方 是 怎 
么 编写 的 ， 是 做 什么 的 。 但 是 ， 也 不 能 完全 是 黑 的 ， 加 载 需 必须 了 解 一 
些 必 要 的 信息 ， 虽 然 不 是 很 多 ， 但 足以 知道 如 何 加 载 用 户 程序 。 


用 户 程序 | | 程序 的 总 长 度 
头 部 。 这 入 站 


古 双 万 虱 | 段 重 定 位 表 项 数 
知道 的 协 
用 户 程序 
加 载 器 (loader) (包括 上 面 的 头 部 ) 





图 8-5 ”加 载 占 与 用 户 程 序 之 则 的 协议 部 分 示意 图 


这 就 涉及 加 载 器 的 编写 者 ， 以 及 用 户 程序 的 编写 者 ， 他 们 之 间 是 怎 
么 协商 的 。 他 们 之 间 必 须 有 一 个 协议 ， 或 者 说 协定 ， 比 如 说 ， 在 用 户 程 
序 内 部 的 某 个 固定 位 置 ， 包 含 一 些 基本 的 结构 信息 ， 每 个 用 户 程序 都 必 
须 把 自己 的 情况 放 在 这 里 ， 而 加 载 器 也 固定 在 这 个 位 置 读 取 。 经 验 表 
明 ， 把 这 个 约定 的 地 点 放 在 用 户 程序 的 开头 ， 对 双方 ， 特 别 是 对 加 载 器 
来 说 比较 方便 ， 这 就 是 用 户 程序 头 部 ， 

头 部 需要 在 源 程序 以 一 个 段 的 形式 出 现 。 这 就 是 代码 清单 8-2 的 第 7 


人 : 


SECTION header vstart=0 


而 且 ， 因 为 它 古 “ 头 部 "， 所 以 ， 访 段 当 然 必须 是 第 一 个 个 定 义 的 段 ， 
且 总 是 位 于 整个 源 程序 的 开头 。 

用 户 程序 头 部 起 但 要 包 侣 以 下 信息 。 

(W 用 尸 程 序 的 尺寸 ， 即 以 凶 市 为 单位 的 大 小 。 这 对 加 载 莫 来 说 是 很 
重要 的 ， 加 载 右 需 要 根据 这 一 信息 来 决定 读 取 多 少 个 逸 辑 忆 区 《在 本 书 
中 ， 所 有 程序 在 使 型 上 所 占用 的 锡 辑 而 区 都 是 连续 的 ) 。 


代码 清单 8-2 中 第 8 行 ， 伪 指令 dd 用 于 声明 和 初始 化 一 个 双 字 ， 即 
一 个 32 位 的 数据 。 用 户 程序 可 能 很 大 ，16 位 的 长 度 不 足以 表示 65535 以 
上 的 数值 。 


程序 的 长 度 取 目 程序 中 的 一 个 标号 “program_end”， 这 是 允许 的 。 在 
编译 阶段 ， 编 译 吉 将 该 标号 所 代表 的 汇编 地 址 填写 在 这 里 。 该 标号 位 于 
整个 源 程 序 的 最 后 ， 从 属于 段 *trai"。 由 于 该 段 并 没有 vstart 子 句 ， 所 
以 ， 标 号 "program_end" 所 代表 的 汇编 地 址 是 从 整个 程序 的 开头 计算 的 。 
换 句 话说 ，program_end 所 代表 的 汇编 地 址 ， 在 数值 上 等 于 整个 程序 的 
1 

双 字 在 内 存 中 的 存放 也 是 按 低 端 序 的 。 如 图 8-6 所 示 ， 低 字 保 存在 低 
地 址 ， 噩 字 保 存在 高 地 址 。 同 时 ， 每 个 字 叉 按 低 症 字 节 序 ， 低 字 市 在 低 
地 址 ， 高 字 和 在 高 地 址 。 

@) 应 用 程序 的 入 口 点 ， 包 括 段 地 址 和 偏 移 地 址 。 加 载 器 并 不 清楚 用 
户 程 序 的 分 段 情 况 ， 更 不 知道 第 一 条 要 执行 的 指令 在 用 户 程 序 中 的 位 
置 。 因 此 ， 必 须 在 头 部 给 出 第 一 条 指令 的 段 地 址 和 仿 移 地 址 ， 这 吏 是 所 
请 的 应 用 程序 入 口 点 CEntry Point) 。 

理想 情况 下 ， 当 用 户 程序 开始 运行 时 ， 执 行 的 第 一 条 指令 是 其 代码 
段 内 的 第 一 条 指令 。 换 句 话 说， 入口 点 位 于 其 代码 段 内 偏 移 地 址 为 0 的 地 
方 。 但 是 ， 情 况 并 非 总 是 如 此 。 尤 其 是 ， 很 多 程序 并 非 只 有 一 个 代码 
段 ， 比 如 本 章 源 代码 清单 8-2 束 包含 了 两 个 代码 段 。 所 以 ， 需 要 在 用 户 程 
序 头 部 明确 给 出 用 户 程序 在 刚 开 始 运行 时 ， 第 一 条 指令 的 位 置 ， 也 惑 是 
第 一 条 指令 在 用 户 程 序 代 码 段 内 的 偏 移 地 址 。 


高 地 址 
高 字 低 字 
一 人 一 一 人 一 


人 : 0x1 2345678 
i 


Ee dt 
! ! 





1 


图 8-6” 双 字数 据 在 内 存 中 的 布局 


代 但 清单 8-2 第 11、12 行 ， 依 人 次 声明 并 初始 化 了 入 口 点 的 仿 移 地 址 
和 段 地 址 。 偏 移 地 址 取 自 代码 段 code 1 中 的 标号 “start"， 段 地 址 是 用 表 
达 式 section.code 1.start 得 到 的 。 


代码 上 段 code_1 是 在 代 公 清早 8-2 的 第 27 行 定义 的 : 
SECTION code 1 align=16 vstart=0 


显而易见 的 是 ， 因 为 段 定义 中 包含 了 “vstart=0” 子 句 ， 故 标号 start 所 
代表 的 汇编 地 址 是 相对 于 当前 代码 7 段 code_1 的 起 始 位 置 ， 从 0 开始 计算 
的 。 

入 口 点 的 段 地 址 是 用 伪 指 令 dd 声明 的 ， 并 初始 化 为 汇编 地 址 
section.code 1.start， 这 是 一 个 32 位 的 地 址 。 不 过 ， 它 仅仅 是 编译 阶段 
确定 的 汇编 地 址 ， 在 用 户 程 序 加 载 到 内 存 后 ， 需 要 根据 加 载 的 实际 位 置 
重新 计算 (浮动 ) 。 

尽管 在 16 位 的 环境 中 ， 一 个 段 最 长 为 64KB， 但 它 却 可 以 起 始 于 任何 
20 位 的 物理 地 址 处 。 你 不 可 能 用 16 位 的 单元 保存 20 位 的 地 址 ， 所 以 ， 
只 能 保存 为 32 位 的 形式 。 


(3) 段 重 定位 表 。 用 户 程序 可 能 包 侣 不 止 一 个 段 ， 比 较 大 的 程序 可 能 
会 包 舍 多 个 代码 段 和 多 个 数据 段 。 这 些 段 如 何 使 用 ， 是 用 户 程序 目 己 的 
事 ， 但 前 提 是 程序 加 载 到 内 存 后 ， 每 个 段 的 地 址 必须 重新 确定 一 下 。 


段 的 重 定位 是 加 载 颖 的 工作 ， 它 需要 知道 每 个 段 在 用 户 程 序 内 的 位 
置 ， 即 它们 分 列 位 于 用 户 程 序 内 的 多 少 字 节 处 。 为 此 ， 需 要 在 用 户 程 订 
头 部 建立 一 张 段 午 定位 表 。 

用 户 程 序 可 以 定义 的 段 在 数量 上 是 不 确定 的 ， 因 此 ， 鼎 重 定位 表 的 
大 小 ， 或 者 说 表 项 数 是 不 确定 的 。 为 此 ， 人 代码 清单 8-2 第 14 行 ， 声 明 并 
人 急 始 化 了 上 段 重 定位 表 的 项 目 数 。 因 为 段 重 定位 表 位 于 两 个 标号 
header end 和 code _1_segment 之 间 ， 而 且 每 个 表 项 占用 4 字 节 ， 故 实 
际 的 表 项 数 为 


(header end - code 1 segment) / 4 
这 个 值 是 在 程序 编 详 阶段 计算 的 ， 先 用 两 个 标号 所 代表 的 汇编 地 址 
相 减 ， 再 除 以 每 个 表 项 的 长 度 4。 


和 对接 独 表 项 数 的 ， 征 实际 的 段 重 定位 表 ， 每 个 表 项 用 伪 指 令 dd 声明 
并 初始 化 为 1 个 双 字 。 代 码 清 单 8-2 一 共 定 义 了 5 个 段 ， 所 以 这 里 有 5 个 
表 项 ， 依 次 计算 段 开始 汇编 地 址 的 表达 式 并 进行 初始 化 。 


8.3 加载 程序 〈 器 ) 的 工作 流程 


8.3.1 初始 化 和 决定 加 载 位 置 


从 大 的 方面 来 说 ， 加 载 器 要 加 载 一 个 用 户 程序 ， 并 使 之 开始 执行 ， 
需要 决定 两 件 事 。 第 一 ， 看 看 内 存 中 的 什么 地 方 是 空闲 的 ， 即 从 哪个 物 
理 内 存 地 址 开始 加 载 用 户 程序 ， 第 二 ， 用 户 程序 位 于 硬盘 上 的 什么 位 
置 ， 它 的 起 始 逻 辑 扁 区 号 是 多 少 。 如 果 你 连 它 在 哪里 都 不 知道 ， 怎 么 找 
得 到 它 呢 | 

现在 ， 让 我 们 把 目光 转移 到 代码 清单 8-1， 来 看 看 加 载 器 都 做 了 哪些 
工作 。 

代码 清单 8-1 第 6 行 ， 加 载 器 程序 的 一 开始 声明 了 一 个 常数 


(const) : 


ap lba start du 100 


常数 是 用 伪 指 令 equ 声明 的 ， 它 的 意思 是 “等 于 。 本 语句 的 意思 是 ， 
用 标号 app lba start 来 代表 数值 100， 今 后 ， 当 我 们 要 用 到 100 的 时 
候 ， 不 这 样 写 : 


mov al,100 
本 | Y_» 、 rad 
而 是 这 样 写 : 
mov al-app lba start 


你 可 能 会 说 ， 这 样 不 是 更 且 烦 吗 ? 

不 会 的 ， 实 际 上 这 很 方便 。 用 某 些 教材 上 的 话说 ， 程 序 中 不 该 使 用 
“不 可 思议 的 数 "。 想 想 看 ， 如 果 在 程序 中 的 多 个 地 方 直接 使 用 数值 100， 
那么 ， 以 后 要 修改 它们 ， 把 它们 改 成 500， 还 得 找到 所 有 使 用 这 个 数值 的 
位 置 ， 一 一 修改 ， 万 一 源 挥 一 个 呢 ?” 如 果 使 用 常量 app_lba_start， 则 只 
需要 重新 把 这 个 和 津 数 的 声明 语句 改 成 下 面 的 形式 ， 并 重新 编译 即 可 。 


FEFFEF 


ROM BIOS 


A0000 


9FFFF 


可 用 的 空间 


10000 
OFFFF 


主 引 导 扇 区 程序 
(加 载 器 ) 及 其 栈 


00000 


图 8-7” 可 用 于 加 载 用 户 程 序 的 空间 范围 





RS L693 Start Squ 30U 


第 数 的 意思 是 在 程序 运行 期 间 不 变 的 数 。 和 其 他 伪 指 令 db、dw、dd 
不 同 ， 用 equ 声明 的 数值 不 占用 任何 汇编 地 址 ， 也 不 在 运行 时 占用 任何 
内 存 位 置 。 它 仅仅 代表 一 个 数值 ， 束 这 么 简单 。 

加 载 用 户 程 序 需 要 确定 一 个 内 存 物理 地 址 ， 这 是 在 代码 清单 8-1 第 
151 行 用 伪 指 令 dd 声明 的 ， 并 初始 化 为 0x10000 的 。 和 前 面 一 样 ， 是 用 
32 位 的 单元 来 容纳 一 个 20 位 的 地 址 : 


Phy ase dq VX10000 


尽管 我 们 用 了 一 个 好 看 的 数 0x10000， 但 你 完全 可 以 把 用 户 程序 加 载 
到 其 他 地 方 ， 只 要 它 是 空闲 的 。 比 如， 可 以 将 这 个 数值 改 成 0xX12340， 唯 
一 的 要 求 是 该 地 址 的 最 低 4 位 必须 是 0， 换 句 话说 ， 加 载 的 起 始 地 址 必须 
是 16 字 贡 对齐 的 ， 这 样 将 来 才能 形成 一 个 有 效 的 段 地 址 。 


如 图 8-7 所 示 ， 物 理 地 址 0xOFFFF 以 下 ， 是 加 载 器 及 其 栈 的 势力 范 
围 ， 物 理 地 址 A0000 以 上 ， 是 BIOS 和 外 围 设备 的 势力 范围 ， 有 很 多 传统 
的 老式 设备 将 自己 的 存储 器 和 只 读 存 储 器 映射 到 这 个 空间 。 

如 此 一 来 ， 可 用 的 空间 就 位 于 0x10000 一 9FFFF ， 差 不 多 500 多 
KB。 事 实 上 ， 如 果 将 低 问 的 内 存 空间 合理 安排 一 下 ， 还 可 以 腾 出 更 多 空 
间 ， 但 是 没有 必要 ， 我 们 用 不 了 多 少 。 


8.3.2 ”准备 加 载 用 户 程序 


和 以 往 不 同 ， 我 们 将 主 引导 刷 区 程序 定义 成 一 个 段 。 代 三 请 单 8-1 第 
9 行 : 


SECTION mbr align=16 vstart=0x7c00 


整个 程序 只 定义 了 这 一 个 段 ， 所 以 它 略 显 多 余 。 之 所 以 这 么 说 ， 是 
因为 ， 即 使 你 不 定义 这 个 段 ， 编 译 右 也 会 自动 把 整个 程序 看 成 一 个 段 。 

但 是 ， 因 为 该 定义 中 有 “vstart=0x7c00” 子 句 ， 所 以 ， 它 就 不 那么 多 
余 了 。 一 旦 有 了 该 子 句 ， 段 内 所 有 元 素 的 汇编 地 址 都 将 从 0x7c00 开始 计 
算 。 和 否则 ， 因 为 主 引导 程序 的 实际 加 载 地 址 是 0x0000:0x7c00， 当 我 们 引 
用 一 个 标号 时 ， 还 得 手工 加 上 那个 落差 O0x7c00。 


代码 清单 8-1 第 12 一 14 行 ， 用 于 初始 化 栈 段 寄存 器 SS 和 栈 指 针 
SP。 之 后 ， 栈 的 段 地 址 是 0x0000， 段 的 长 度 是 64KB， 栈 指针 将 在 段 内 
0xFFFF 和 0x0000 之 间 变 化 。 


代 但 消 蛙 8-1 第 16、17 行 ， 用 于 取得 一 个 地 址 ， 用 户 程 序 将 要 从 这 
个 地 址 处 开始 加 载 。 


该 地 址 实际 上 是 保存 在 标号 phy_base 处 的 一 个 双 字 单元 里 。 这 是 一 
个 32 位 的 数 ， 在 16 位 的 处 理 器 上 ， 只 能 用 两 个 寄存 器 存放 。 如 图 8-8 所 
示 ，32 位 数 内 存 中 的 存放 是 投 低 顺序 列 上 时， 高 16 位 处 在 phy_base 十 
0x02 处 ， 可 以 放 在 寄存 需 DX 中 ; 低 16 位 处 在 phy_base 处 ， 可 以 用 寄 
存 器 AX 存 放 。 

这 两 条 指令 中 都 使 用 了 段 超越 前 缀 “cs:"。 这 是 允许 的 ， 意 味 着 在 访 
问 内 存单 元 时 ， 使 用 CS 的 内 容 作 为 段 基 址 。 之 所 以 没有 使 用 DS 和 ES， 
是 因为 它们 另 有 安排 。 


另外 注意 ， 因 为 段 寄 存 嚣 CS 的 内 容 是 0x0000， 而 且 主 引导 而 区 是 
位 于 0x0000:0x7c00 处 的 ， 所 以 ,理论 上 指令 中 的 偏 移 地 址 应 当 是 
0x7c00 十 phy_base 。 不 过 ， 因 为 我 们 定义 段 mbr 的 时 候 ， 使 用 了 
“start=0x7c00? 子 句 ， 故 段 内 所 有 汇编 地 址 都 是 在 0x7c00 的 基础 上 增加 
的 ， 就 不 用 再 加 上 这 个 0x7c00 了 ， 直 接 是 


高 地 址 
寄存 器 DX 寄存 器 AX 
人 


phy base 十 0x02 


| | 


图 8-8 获取 用 于 加 载 用 户 程序 的 物理 地 址 


低 字 





phy_base 


mov ax [csphy basel 


mov Qx [es :phy baset0x02| 


条 接 看 ， 代 人 码 清单 8-1 第 18 一 21 行 ， 用 于 将 该 物理 地 址 变 成 16 位 的 
段 地 址 ， 并 传送 到 DS 和 ES 寄存 项。 因为 该 物理 地 址 是 16 字 节 对 章 的 ， 
直接 右 移 4 位 即 可 。 实 际 上 ， 石 移 4 位 相当 于 除 以 16 (0x10) ， 所 以 程 
序 中 的 做 法 将 这 个 32 位 物理 地 址 (DX:AX) 除 以 16《〈 在 寄存 花 BX 
中 ) ， 寄 和 存 右 AX 中 的 两 束 是 得 到 的 段 地 址 (在 本 程序 中 是 0x1000) 。 


8.3.3 ”外围 设备 及 其 接口 


加 载 硕 的 下 一 个 工作 是 从 使 盘 谈 取 用 户 程 序 ， 识 日 了 束 是 访问 其 他 
使 件 。 和 处 理 融 打 交道 的 使 件 很 多 ， 不 单单 是 便 盘 ， 还 有 蛙 示 各、 网 络 


设备 、 扬 声 左 《喇叭 ) 和 话 简 〈 麦 交 风 ) 、 键 盘 、 鼠 标 等 。 有 时 候 ， 根 
据 应 用 的 场合 ， 还 会 接 一 些 你 不 认识 和 没 见 过 的 东西 。 


所 有 这 些 和 计算 机 主机 连接 的 设备 ， 痢 围绕 在 主机 周围 ， 争 着 跟 计 
算 机 说 话 ， 叫 做 外 围 设备 《Peripheral Equipment) 。 一 般 来 说 ， 我 们 把 
这 些 设备 分 成 两 种 ， 一 种 是 输入 设备 ， 比 如 键 往 、 鼠 标 、 麦 列 风 、 援 像 
头等 ; 另 一 种 是 输出 设备 ， 比 如 显示 器 、 打 印 机 、 扬 声 器 等 。 输 入 设备 
和 输出 设备 统称 输入 输出 (nput/Output，1/O) 设备 。 


每 一 种 设备 部 有 目 己 的 怪 脾 气 ， 都 有 和 列 的 设备 不 一 样 的 工作 方 
式 。 比 如 ， 扬 声 占 需要 有 的 是 模拟 信 写 ， 每 个 扬 声 右 需要 两 根 线 ， 用 的 揪 
头 也 赴 无 线 电 行业 里 的 标准 ， 话 位 也 是 如 此 ; 老式 键盘 只 用 一 根 线 问 主 
机 传达 按键 的 ASCI 码 ， 而 且 一 二 采用 PS/2 标准 ; 狐 式 的 USB 键盘 尽管 
也 使 用 串 行 方式 工作 ， 但 信号 却 和 老式 键盘 完全 不 同 。 至 于 网 络 设 施 ， 
现在 流行 的 是 里 面 有 8 根 线 必 的 五 闫 双 绥 线 ， 里 面 的 信号 也 有 专门 的 标 
准 。 

一 句 话 ， 不 同 的 设备 ， 有 不 同 的 连 线 数 量 ， 线 里 面 传送 的 信号 也 不 
一 样 ， 而 且 各 目的 插 尖 和 插 扎 也 干 友 万 列 ， 这 该 如 何 让 处 理 闫 跟 它 打 交 
1 下? 


话 虽 这 么 说 ， 但 这 些 东西 不 让 处 理 喜 访问 和 控制 却 不 行 。 很 明显 ， 
这 里 需要 一 些 信和 写 转 换 右 和 变速 齿轮 ， 这 就 是 I/O 接口 。 举 儿 个 例子 ， 志 
克 风 和 扬 声 和 项 需要 一 个 WO 接口 ， 即 声卡 ， 才 能 与 处 理 帮 沟通， 显示 右 也 
需要 一 个 WHO 接口 ， 即 显卡 ， 才 能 与 处 理 震 沟通 ; USB 键盘 同样 需要 一 
个 MO 接口 ， 即 USB 接口 ， 才 能 与 处 理 问 沟通 。 很 显然 ,不同 的 外 围 设 
备 ， 部 有 各 目 个 同 的 I/O 接口 。 


MO 接口 可 以 是 一 个 电路 板 ， 也 可 能 是 一 块 小 心 厂 ， 这 取决 于 它 有 多 
复 淋 。 无 论 如 何 ， 它 是 一 个 典型 的 变换 右 ， 或 者 说 是 一 个 翻 详 融 ， 在 一 
边 ， 它 按 处 理 规 的 信 筷 规程 工 作 ， 负 责 把 处 理 融 的 信号 转换 成 外 围 设备 
能 接受 的 为 一 种 信和 号; 在 另 一 边 ， 它 也 做 同样 的 工作 ， 把 外 围 设备 的 信 
号 变换 成 处 理 硕 可 以 接受 的 形 却 。 

这 还 没完 ， 后 面 还 有 两 个 麻烦 的 问题 。 


GO 不 可 能 将 所 有 的 I/O 接口 直接 和 处 理 器 相连 ， 设 备 那么 多 ， 还 有 
些 设备 现在 没有 友 明 出 来 ， 将 来 一 定 会 有 有 。 你 怎么 办 ? 


@) 每 个 设备 的 VO 接口 都 抢 着 和 处 理 器 说 话 ， 不 发 生 冲 突 都 难 。 你 
怎么 办 ? 

对 第 1 个 问题 的 解答 是 采用 总 线 技 术 。 总 线 可 以 认为 是 一 排 电 线 ， 所 
有 的 外 围 设备 ， 包 括 处 理 器 ， 都 连接 到 这 排 电 线 上 。 但 是 ， 每 个 连接 到 
这 排 电 线 上 的 器 件 都 必须 有 拥有 电子 开关 ， 以 使 它们 随时 能 够 同 这 排 电 
线 连 接 ， 或 者 从 这 排 电 线 上 断 开 (脱离 )。 这 束 好 比 是 公共 车 道 ， 当 路 
面 上 有 车 时 ， 你 就 必须 退 避 一 下 ， 不 能 硬 冲 上 去 。 因 此 ， 这 排 公 共 电 线 
就 称 为 总 线 (Bus) 。 

对 第 2 个 问题 的 解答 是 使 用 输入 和 输出 控制 设备 集中 器 〈J/O Controller 
Hub，ICH) 芯片 ， 访 芯片 的 作用 是 连接 不 同 的 总 线 ， 并 协调 各 个 VO 接 
口 对 处 理 喜 的 访问 。 在 个 人 计算 机 上 ， 这 坎 必 片 束 是 所 谓 的 南 桥 。 

如 图 8-9 所 示 ， 处 理 器 通过 局 部 总 线 连 接 到 ICH 内 部 的 处 理 接口 电 
路 。 然 后 ， 在 ICH 内 部 ， 又 通过 总 线 与 各 个 VO 接口 相连 。 

















输入 输出 控制 设备 集中 器 〈 芯 片 ) 鼠标 
键盘 
USB 接 口 U 盘 
IDE/SATA ry 
接口 硬盘 1 
局 部 总 线 emi 
z 演 时 钟 /DMA/ 
\ 3 1 IDE/SATA 总 线 
汪 器 /网 络 / 
LPC/ 电 源 
管理 等 接口 
PCIGE) 总 线 独立 的 声卡 、 显 卡 等 
PCIPCIE 加 
接口 
PCIGE) 总 线 扩展 本 


图 8-9 计算 机 内 部 总 线 系统 示意 图 


在 ICH 内 部 ， 集 成 了 一 坚 常 规 的 外 围 设 备 接口 ， 如 USB、 
PATA (IDE〉、SATA、 老 式 总 线 接口 (LPC) 、 时 钟 等 ， 这 些 东西 对 计 
算 机 来 说 必 不 可 少 ， 故 直接 集成 在 ICH 内 ， 我 们 后 面 还 会 详细 介绍 它们 
的 功能 。 

除了 这 些 第 用 的 、 必 个 可 少 的 设备 之 外 ， 有 坚 设 备 你 可 能 暂时 用 不 
上 ， 也 有 有些 设备 还 没有 发 明 出 来 ， 但 述 早 有 可 能 连 在 计算 机 上 。 不 官 古 
什么 设备 ， 都 必须 通过 它 自 己 的 I/O 接口 电路 同 ICH 相连 。 为 了 方便 ， 最 


好 是 在 主板 上 做 一 些 插 档 ， 同 时 ， 每 个 设备 的 I/O 接口 电路 都 设计 成 插 
卡 。 这 样 ， 想 接 上 该 设备 时 ， 就 把 它 的 MO 接口 卡 插 上 ， 不 需要 时 ， 随 时 
拔 下 。 

为 了 实现 这 个 目的 ， 或 者 说 为 了 文 持 更 多 的 设备 ，ICH 还 提供 了 对 
PCI 或 者 PCI Express 忆 线 的 支持 ， 该 总 线 癌 外 延伸 ， 连 接着 主板 上 的 若 
干 个 扩展 槽 ， 吏 是 刚才 说 的 插 槽 。 举 个 实例 ， 如 果 你 想 连 接 显示 堪 ， 那 
么 束 要 先 插 入 显卡 ， 人 然后 再 把 显示 器 接 到 显卡 上 。 


除了 局 部 总 线 和 PCI Express 总 线 ， 每 个 IO 接口 卡 可 能 连接 不 止 一 
个 设备 。 比 如 USB 接口 ， 就 有 可 能 连接 一 大 堆 东 西 : 键盘、 忌 标 、U 秀 
等 。 因 为 同类 型 的 设备 较 多 ， 也 涉及 线路 复 用 和 仲裁 的 问题 ， 故 它们 也 
有 目 己 的 总 线 体系 ， 称 为 通信 息 线 或 者 设备 总 线 。 比 如 儿 8-9 所 示 的 USB 
总 线 和 SATA 总 线 。 


当 处 理 器 想 同 某 个 设备 说 话 时 ，ICH 会 接 到 通知 。 然 后 ， 它 负责 提 
供 相 应 的 传输 通道 和 其 他 辅助 文 持 ， 并 命令 所 有 其 他 无 天 设备 财 踪 。 同 
样 ， 当 某 个 设备 要 跟 处 理 需 说话， 情况 也 是 一 样 。 


8.3.4 ”I/O 端口 和 端口 访问 


外 围 设备 和 处 理 右 之 间 的 通信 和 十 退 过 相应 的 I/O 接口 进行 的 。 当 然 ， 
这 么 说 太 过 于 笼统 ， 所 以 必须 其 体 到 细 方 上 来 讲 这 件 事 。 


具体 地 说 ， 处 理 器 是 通过 端口 (Port) 来 和 外 围 设备 打交道 的 。 本 质 
上 ， 端 口 就 是 一 些 寄 存 器 ， 类 似 于 处 理 器 内 部 的 寄存 器 。 不 同 之 处 仅仅 
在 于 ， 这 些 叫 做 端口 的 寄存 器 位 于 IJ/O 接口 电路 中 。 

端口 是 处 理 器 和 外 围 设备 通过 I/O 接口 交流 的 窗口 ， 每 一 个 MO 接口 
都 可 能 拥有 好 几 个 端口 ， 分 别 用 于 不 同 的 目的 。 比 如 ， 连 接 人 硬盘 的 
PATA/SATA 接口 承 有 几 个 端口 ， 分 别 是 命令 端口 〈 当 回访 端口 写 入 0x20 
时 ， 表 明 是 从 硬盘 读数 据 ， 写 入 0x30 时 ， 表 明 是 向 硬盘 写 数 据 ) 、 状 态 
闪 口 《处理 器 根据 这 个 端口 的 数据 来 判断 硬盘 工作 是 个 正常 ， 操 作 是 人 否 
成 功 ， 发 生 了 哪 种 错误 ) 、 参 数 端口 〈 处 理 器 通过 这 些 端 口 告诉 硬盘 读 
写 的 忆 区 数量 ， 以 及 起 始 的 逻辑 扇 区号) 和 数据 端口 〈 通 过 这 个 端口 连 
续 地 取得 要 读 出 的 数据 ， 或 者 通过 这 个 端口 连续 地 发 送 要 写 入 硬盘 的 数 
十 


问 口 只 不 过 是 位 于 VO 接口 上 的 寄存 吉 ， 所 以 ， 每 个 问 口 有 目 己 的 数 
据 宽 度 。 在 早期 的 系统 中 ， 端 口 可 以 是 8 位 的 ， 也 可 以 是 16 位 的 ， 现 在 
有 些 端 口 会 是 32 位 的 。 到 底 是 8 位 还 是 16 位 ， 这 是 设备 和 |/O 接口 制造 
者 的 自由 。 比 如 ，PATA/STAT 接口 中 的 数据 端口 束 是 16 位 的 ， 这 有 助 于 
加 快 数据 传输 速率 ， 提 高 传输 效率 。 


端口 在 不 同 的 计算 机 系统 中 有 痢 不 同 的 实现 方式 。 在 一 些 计 算 机 系 
统 中 ， 端 口号 是 映射 到 内 存 地 址 空间 的 。 比 如 ，0x00000 一 0xE0000 是 
真实 的 物理 内 存 地 址 ， 而 0xE0001 一 0xFFFFF 是 从 很 多 VO 接口 那里 映 
射 过 来 的 ， 当 访问 这 部 分 地 址 时 ， 实 际 上 是 在 访问 IJO 接口 。 


而 在 另 一 些 计 算 机 系统 中 ， 端 口 是 独 立 编 址 的 ， 不 和 内 存 发 生 关 
系 。 如 图 8-10 所 示 ， 在 这 种 计算 机 中 ， 处 理 需 的 地 址 线 既 连接 内 存 ， 也 
连接 每 一 个 VO 接口 。 但 是 ， 处 理 器 还 有 一 个 特殊 的 引 脚 M/IO#， 在 这 
里 ，“ 帮 表示 低 电 平 有 效 。 也 就 是 说 ， 当 处 理 器 访问 内 存 时 ， 它 会 让 
M/IO# 引 脚 呈 高 电 平 ， 这 里 ， 和 内 存 相 关 的 电路 就 会 打开 ; 相反 ， 如 果 处 
理 需 访问 JWO 端口 ， 那 么 M/IO# 引 脚 呈 低 平 ， 内 存 电路 被 茶 止 。 与 此 同 
时 ， 处 理 坪 发 出 的 地 址 和 M/IO# 信 号 一 起 用 于 打 个 某 个 VO 接口 ， 如 果 议 
IO 接口 分 配 的 端口 号 与 处 理 器 地 址 相 吻 合 的 话 。 


Intel 处 理 器 ， 早 期 是 独立 编 址 的 ， 现 在 既 有 内 存 映 射 的 ， 也 有 独立 
编 址 的 。 在 本 章 中 ， 我 们 只 讲 独 立 编 址 的 亲口 。 

所 有 端口 都 是 统一 编号 的 ， 比 如 0x0001、0x0002、0x0003、... 
个 1/O 接口 电路 都 分 配 了 硅 干 个 端口 ， 比 如 ，1/O 接口 A 有 3 个 端口 ， 
口号 分 别 是 0x0021 一 0x0023; 1/O 接口 B 需要 5 个 端口 ， 端 口号 分 别 
0x0303 一 0x0307。 


一 个 现实 的 例子 是 个 人 计算 机 中 的 PATA/SATA 接口 〈 图 8-9) ， 每 个 
PATA 和 SATA 接口 分 配 了 8 个 端口 。 但 是 ，ICH 芯片 内 部 通常 集成 了 两 
个 PATA/SATA 接口 ， 分 别 是 主 硬盘 接口 和 副 人 硬盘 接口 。 这 样 一 来 ， 主 便 
盘 接 口 分 配 的 端口 号 是 0x1f0 一 0x1f7， 副 硬盘 接口 分 配 的 端口 号 是 0x170 
~—~OQx177。 


呈 节 虱 





M/IO# 


图 8-10” 闹 口 的 访问 和 M/IO# 引 肢 


在 Intel 的 系统 中 ， 只 人 允许 65536〈 十 进 制 数 ) 个 端口 存在 ， 端 口号 
从 0 到 65535 〈0x0000 一 0xfff) 。 因 为 是 独立 编 址 ， 所 以 ， 疹 口 的 访问 
不 能 使 用 类 似 于 mov 这 样 的 指令 ， 取 而 代 之 的 征 in 和 out 指令 。 


in 指令 是 从 端口 读 ， 它 的 一 般 形式 是 
in 过 由 ;yd 

或 者 
1 志文 QZ 


这 就 是 说 ，in 指令 的 目的 操作 数 必 须 是 寄存 器 AL 或 者 AX， 当 访问 8 
位 的 病 口 时 ， 使 用 寄存 右 AL; 访问 16 位 的 问 口 时 ， 使 用 AX。in 指令 的 
源 操 作 数 应 当 是 寄存 右 DX。 

in al,dx 的 机 器 指令 码 是 0xEC，in ax,dx 的 机 器 指令 人 码 是 0xED， 都 
是 一 字 节 的 。 之 所 以 如 此 简短 ， 是 因为 in 指令 不 允许 使 用 别 的 通用 等 存 
研 ， 也 不 允许 使 用 内 存单 元 作为 操作 数 。 

也 许 是 为 了 方便 ，in 指令 还 有 两 字 市 的 形式 。 此 时 ， 前 一 字 节 是 操 
作 码 0xE4 或 者 0xXE5， 分 别 用 于 指示 8 位 或 者 16 位 闹 口 访问 ; 后 一 字 市 
是 立即 数 ， 指 示 闹 口号 。 

因此 ， 机 器 指令 E4 F0 就 相当 于 汇编 语言 指令 


于 人 有 于 站 交 二 


而 机 器 指令 E5 03 就 相当 于 汇编 语言 指令 
in ax 0x03 


很 显然 ， 因 为 这 种 指令 形式 的 操作 数 部 分 只 人 允许 一 字 节 ， 故 只 能 访 
问 0 一 255 (0x00 一 0xff) 号 端口 ， 不 允许 访问 大 于 255 的 端口 号 。 所 
以 ， 下 面 的 汇编 语言 指令 束 是 非法 的 : 


ini dX ,0xXofd 


in 指令 不 影响 任何 标志 位 。 

相应 地 ， 如 果 要 通过 病 口 同 外 围 设备 发 送 数 据 ， 则 必须 通过 out 指 
令 。 

out 指令 正好 和 in 指令 相反 ， 目 的 操作 数 可 以 是 8 位 立即 数 或 者 寄存 
器 DX， 源 操作 数 必 须 是 寄存 器 AL 或 者 AX。 下 面 是 一 些 例子 : 


Gut (0X37,a1l ; 写 0x37 号 端口 《这 是 一 个 8 位 端口 ) 

GUE 0Xxf5., ax ; 写 0xf5 号 关口 〈 这 是 一 个 16 位 端口 

GE dx .21 :这 是 一 个 8 位 问 口 ， 端 口号 在 寄存 器 DX 中 
out dx,ax ;这 是 一 个 16 位 端口 ， 端 口号 在 寄存 器 DX 中 


和 in 指令 一 样 ，out 指令 不 影响 任何 标志 位 。 
8.3.5 ”通过 硬盘 控制 大 器 口 谈 届 区 数据 


现在 ， 让 我 们 来 看 看 使 盘 。 

便 盘 读 写 的 基本 早 位 是 情 区 。 就 是 说 ， 要 读 束 至 少 读 一 个 出 区， 要 
写 就 至少 写 一 个 届 区 ， 不 可 能 仪 读 写 一 个 届 区 中 的 几 个 字 节 。 这 样 一 
来 ， 吏 使 得 主机 和 使 熏 之 间 的 数据 交换 是 成 块 的 ， 所 以 硬盘 是 典型 的 其 
设备 。 

从 便 盘 读 写 数据 ， 最 经 典 的 方式 苹 问 便 盘 控制 如 分别 友 克 做 头 写 、 
柱 面 于 和 刷 区 号 〈 届 区 在 茶 个 柱 面 上 的 编号 ) ， 这 称 为 CHS 模式 。 这 种 
方法 最 原始 ， 最 卓然 ， 也 最 容易 理解 。 

实际 上 ， 在 很 多 时 候 ， 我 们 并 不 天 心 届 区 的 物理 位 置 ， 所 以 布衣 所 
有 的 司 区 部 能 统一 编 址 。 这 束 古 逻辑 珊 区 ， 它 把 便 盘 上 所 有 可 用 的 导 区 


者 一 一 从 0 编号 ， 而 不 管 它 位 于 哪个 盘面 ， 也 不 管 它 属于 哪个 柱 面 。 


关于 硬盘 和 逻辑 扇 区 的 知识 前 面 已 经 有 所 介绍 ， 这 里 不 再 歼 述 。 最 
早 的 逻辑 局 区 编 址 方法 是 LBA28， 使 用 28 个 比特 来 表示 好 辑 珊 区 号 ， 从 
逻辑 肩 区 0x0000000 到 0xFFFFFFF， 共 可 以 表示 228 王 268435456 个 扇 
区 。 每 个 扇 区 有 512 字 节 ， 所 以 LBA28 可 以 管理 128 GB 的 人 硬盘。 


人 硬盘 技术 发 展 得 非常 快 ， 最 新 的 硬盘 已 经 达到 儿 百 个 吉 字 节 的 容 
量 ，LBA28 己 经 洛 后 了 。 住 这 种 情况 下 ， 业 界 义 共同 推出 了 LBA48， 采 
用 48 个 比特 来 表示 逻辑 扇 区 号 。 如 此 一 来 ， 束 可 以 管理 131072 TB 的 硬 


Pa _ 
盘 容 量 了 。 
LEB = T1024MEB 


1TB = 1024GB 


在 本 章 中 ， 我 们 将 采用 LBA28 来 访问 硬盘 。 

前 面 说 过 ， 个 人 计算 机 上 的 主 硬盘 控制 器 被 分 配 了 8 位 端口 ， 端 口号 
从 0x1f0 到 0x1f7。 假 设 现 在 要 从 硬盘 上 读 逻 辑 恒 区 ， 那 么 ， 整 个 过 程 如 
下 。 

第 1 步 ， 设 置 要 读 取 的 扇 区 数量 。 这 个 数值 要 写 入 0x1f2 端口 。 这 是 
个 8 位 端口 ， 因 此 每 次 只 能 该 写 255 个 而 区 : 


mov QQx, O12 
BT Ox0l ;1 个 局 区 


Gut Wxsal 


注意 ， 如 果 与 入 的 值 为 0， 则 表示 要 谈 取 256 个 夯 区 。 每 谈 一 个 局 
区 ， 这 个 数值 束 减 一 。 因 此 ， 如 果 在 读 与 过程 中 发 生 错误 ， 访 端口 包含 
独 尚 未 谈 取 的 而 区 数 。 

第 2 步 ， 设 置 起 始 LBA 局 区 亏 。 忆 区 的 恋 写 是 连续 的 ， 因 此 只 需要 
给 出 第 一 个 扇 区 的 编号 就 可 以 了 。28 位 的 扇 区 号 太 长 ， 需 要 将 其 分 成 4 
段 ， 分 别 写 入 端口 0x1f3、0x1M4、0x1f5 和 0x1f6 号 端口 。 其 中 ，0x1f3 
号 端口 存放 的 是 0 一 7 位 : 0x1f4 写 妆 口 存放 的 是 8 一 15 位 ，0x1f5 号 端口 
存放 的 是 16 一 23 位 ， 最 后 4 位 在 0x1f6 号 端口 。 假 定 我 们 要 读 写 的 起 始 
逻辑 扇 区 号 为 0x02， 可 编写 代码 如 下 : 


Gut dx.al ;LBA 地 址 7 一 0 

ine dx ;0xl1f4 

mov al,0x00 

Sut dx a1 ;LBA 地 址 15 一 8 

inic dx ?0x1 

out dx,al ;LBA 地 址 23 一 16 

LE dx 20x1E6 

nov al. OXe0 ;LBA 模式 ， 主 人 硬盘， 以 及 LBRA 地 址 27 一 24 


注意 以 上 代码 的 最 后 4 行 ， 在 现行 的 体系 下 ， 每 个 PATA/SATA 接口 
允许 挂 接 两 块 人 硬盘 ， 分 别 是 主 盘 (Master) 和 从 稻 (Slave) 。 如 图 8-11 
所 示 ，0x1f6 闪 口 的 低 4 位 用 于 存放 馆 辑 夯 区 亏 的 24 一 27 位 ， 第 4 位 用 于 
指示 便 盘 号 ，0 表示 主 盘 ，1 表示 从 各。 局 3 位 是 “111*"， 表 示 LBA 模式 。 


7 6 人 4 3 3 ] 0 
逻辑 局 区 号 27~~24 位 
0: CHS 


l: LBA 





0: 主 硬盘 
1: 从 硬盘 


图 8-11 ”端口 1f6 各 位 的 含义 


第 3 步 ， 向 端口 0x1f7 写 入 0x20， 请 求 硬 盘 读 。 这 也 是 一 个 8 位 端 
口 : 


moO Cx UXLEY7 


Ei 
> 
> 


mov al,O0Ox20 


SUt dX al 


第 4 步 ， 等 待 读 写 操 作 完 成 。 端 口 0x1f7 既是 命令 端口 ， 又 是 状态 端 
口 。 在 通过 这 个 端口 发 送 读 写 命令 之 后 ， 人 硬盘 就 忙 乎 开 了 。 如 图 8-12 所 
示 ， 在 它 内 部 操作 期 间 ， 它 将 0x1f7 端口 的 第 7 位 置 “1”"， 表 明 自 己 很 忙 。 
一 旦 硬盘 系统 准备 就 绕 ， 它 再 将 此 位 清 零 ， 说 明 自 己 已 经 忙 完了 ， 同 时 


将 第 3 位 置 “1”， 意 思 是 准备 好 了 ， 请 求 主机 发 送 或 者 接收 数据 (图 8- 
12) 。 完 成 这 一 步 的 典型 代码 如 下 : 


mowv dx, OQxLf1] 
-Walts: 
iN a 0 
and a GxB8 
cmp al,O0x08 
nz swaits ;不 忙 ， 且 硬盘 已 准备 好 数据 传输 


7 6 5 4 3 2 ] 0 
为 1 表示 


硬盘 
el 为 1 表明 硬盘 已 准备 


好 和 主机 交换 数据 


为 1 表明 前 一 个 命令 执行 错误 。 具 
体 原 因 可 访问 闪 口 0x1fl 


图 8-12 ”端口 0x1f7 部 分 状态 位 的 含义 


来 看 看 指令 and al,0x88。0x88 的 二 进 制 形式 是 10001000， 这 意味 
着 我 们 想 用 这 条 指令 保留 住 寄存 器 AL 中 的 第 7 位 和 第 3 位 ， 其 他 无 关 的 
位 都 清 零 。 此 时 ， 如 果 寄 存 器 AL 中 的 二 进 制 数 是 00001000 (0x08)， 
那 就 说 明 可 以 退出 等 待 状态 ， 继 续 往 下 操作 ， 和 否则 继续 等 待 。 


第 5 步 ， 连 续 取出 数据 。0x1f0 是 硬盘 接口 的 数据 端口 ， 而 且 还 是 一 
个 16 位 端口 。 一 旦 硬盘 控制 器 空闲 ， 且 准备 就 绪 ， 就 可 以 连续 从 这 个 端 
趾 写 入 或 者 读 取 数据 。 下 面 的 代码 假定 是 从 人 硬盘 读 一 个 届 区 (512 字 
节 ， 或 者 256 字 市 ) ， 读 取 的 数据 存放 到 由 上 段 琳 存 占 DS 指定 的 数据 段 ， 
偏 移 地 址 由 寄存 硕 BX 指定 : 


mov cx,256 ; 总 共 要 读 取 的 字数 
IO dx OxLf0 

.readw: 
工程 向 交 ,对 广 


mowvw [Wx|sac 
ddd Bx 


loop .readw 


最 后 ，0x1f1 端口 是 错误 寄存 器 ， 包 含 硬盘 驱动 器 最 后 一 次 执行 命令 
后 的 状态 〈 错 误 原因 ) 。 


8.3.6 ”过 程 调用 


恋 写 便 盘 是 经 闻 要 做 的 事 ， 尤 其 对 于 操作 系统 来 说 。 即 使 是 在 本 草 
的 程序 中 ， 也 多 次 肥 生 。 如 末 每 次 读 与 便 盘 都 护 上 面 的 5 个 步骤 与 一 扒 代 
但 ， 程 序 势 必 很 大 ， 也 会 令 人 烦恼 。 

好 在 处 理 器 文 持 一 种 叫 过 程 调用 的 指令 执行 机 制 。 过 程 
(Procedure ) 义 叫 例 程 ， 或 者 于 程序 、 子 过 程 、 了 于 例 程 (Sub- 
routine ) ， 不 党 怎么 称呼 ， 实质 都 一 样 ， 者 是 一 段 普 通 的 代 但 。 处 理 套 
可 以 用 过 程 调用 指令 转移 到 这 段 代 码 执 行 ， 在 过 到 过 程 返 回 指令 时 重新 
返回 到 调用 处 的 下 一 条 指令 接着 执 行 。 

如 图 8-13 所 示 ， 这 是 过 程 和 过 程 调 用 的 示意 图 。 下 面 结合 本 章 代 码 
清音 来 具体 说 明 。 


子 程序 执行 流 各 
主 程序 执行 流程 
ph 
调用 过 程 (call) 
用 pop 指 令 恢 复 现场 
主 程序 执行 流程 过 程 返 回 〈ret) 


图 8-13 ”过 程 和 过 程 调用 示意 图 


在 8.3.1 市 里 ， 我 们 已 经 定义 了 第 量 app_lba_start， 它 代表 的 值 古 
100， 也 束 是 用 尸 程 序 在 便 盘 上 的 起 始 逻 辑 琐 区 写 。 现 在 ， 代 公 消 单 8-1 
的 第 24 一 27 行 用 于 从 便 盘 上 读 取 这 个 琐 区 的 内 容 。 这 很 好 理解 ， 因 为 个 
知道 用 尸 程 序 到 拘 有 多 大 ， 到 压 占 用 了 多 少 个 而 区 ， 所 以 ， 可 以 先 读 它 
的 第 一 个 珊 区 。 该 山区 包含 了 用 户 程 序 的 尖 部 ， 而 用 尸 程序 类 部 义 包 含 


了 广 程 序 的 大 小 、 人 入口 点 和 段 重 定位 表 。 所 以 ， 通 过 分 析 头 部 ， 束 知道 
接着 还 要 再 读 多 少 个 面 区 才能 完全 加 载 用 户 程 序 。 


因为 要 多 次 谈 取 硬盘 ， 而 每 次 的 步骤 又 都 兰 不 多 ， 所 以 ， 我 们 精心 
设计 了 一 段 通用 的 代码 ， 它 从 代码 清单 8-1 的 第 79 行 开 始 ， 一 直到 第 131 
行 结束 ， 这 驶 是 我 们 所 说 的 过 程 。 

要 调用 过 程 ， 需 要 该 过 程 的 地 址 。 一 般 来 说 ， 过 程 的 第 一 条 指令 需 
要 一 个 标号 ， 以 方便 引用 该 过 程 。 所 以 ， 代 码 清单 8-1 第 79 行 是 一 个 标 
号 “read_hard disk_ 0"”， 意 思 是 读 《〈 第 一 个 便 盘 控制 器 的 ) 主 盘 ， 当 然 ， 
什么 意思 并 不 重要 。 


编写 过 程 的 好 处 是 只 用 编写 一 次 ， 以 后 只 需要 “调用 ? 即 可 。 上 所以， 代 
人 码 的 灵活 性 和 通用 性 尤其 重要 。 具 体 到 这 里 ， 束 是 每 次 读 人 硬盘 时 的 起 始 
逻辑 而 区 号 和 数据 保存 位 置 都 不 相同 ， 这 惑 涉及 所 谓 的 参数 传递 。 

参数 传递 最 简单 的 办 法 是 通过 寄存 器 。 在 这 里 ， 主 程序 把 起 始 逻 辑 
情 区 号 的 高 16 位 存放 在 寄存 器 DI 中 (只 有 低 12 位 是 有 效 的 ， 高 4 位 必 
须 保证 为 “0”) ， 低 16 位 存放 在 寄存 占 Sl 中 ( 没 办 法 ，16 位 的 处 理 喜 无 
法 直接 处 理 28 位 的 数据 ) ; 并 约定 将 读 出 来 的 数据 存放 到 由 段 寄 存 器 DS 
指 问 的 数据 段 中 ， 起 始 偏 移 地 址 在 寄存 右 BX 中 。 

在 调用 过 程 前 ， 程 序 会 用 到 一 些 寄存 器 ， 在 过 程 返回 之 后 ， 可 能 还 
要 继续 使 用 。 为 了 不 失 连 续 性 ， 在 过 程 的 开头 ， 应 当 将 本 过 程 要 用 到 
(内 容 肯 定 会 被 破坏 〉 的 寄存 器 临时 压 栈 ， 并 在 返回 到 调用 点 之 前 出 栈 
恢复 。 代 人 码 清单 8-1 的 第 82 一 85 行 ， 用 于 将 过 程 中 用 到 的 寄存 器 入 栈 保 
人 

后 面 的 指令 都 很 好 理解 ， 第 87 一 89 行 ， 是 向 0x1f2 端口 写 入 要 读 取 
的 而 区 数 。 显 而 易 见 ， 每 次 读 的 而 区 数 是 1 个 。 

第 91 一 101 行 ， 用 于 癌 人 硬盘 接口 写 入 起 始 逻 辑 忆 区 与 的 低 24 位 。 低 
16 位 在 寄存 器 SI 中， 高 12 位 在 等 存 占 D1 中 ， 需 要 不 俘 地 倒 换 到 寄存 噩 
AL 中 ， 以 方便 端口 写 入 。 

第 105 行 ， 程 序 执行 到 这 里 时 ， 寄 存 器 AH 的 低 4 位 是 起 始 逻辑 证 区 
号 的 27 一 24 位 ， 高 4 位 是 全 “0”;， 宵 存 右 AL 中 是 0xe0。 执 行 or 指令 后 ， 
将 会 在 寄存 器 AL 中 得 到 它们 的 组 合 值 ， 高 4 位 是 0xe， 低 4 位 是 逻辑 而 区 
号 的 27 一 24 位 。 


第 118 一 124 行 ， 用 于 反复 从 使 盘 接 口 那 里 取得 512 字 节 的 数据 ， 并 
传送 到 段 寄 存 右 DS 所 指 癌 的 数据 区 中 。 每 传送 一 个 字 ，BX 的 值 融 增 2， 
以 指 同 下 一 个 偏 移 位 置 。 


第 126 一 129 行 ， 用 于 把 调用 过 程 前 各 个 寄存 器 的 内 容 从 栈 中 恢复 。 

最 后 ， 因 为 处 理 器 是 没有 大 脑 的 ， 所 以 需要 一 个 明确 的 指令 ret 促使 
它 离开 过 程 ， 从 哪里 来 回 哪 里 去 ， 这 条 指令 稍 后 就 会 讲 到 。 

有 关 过 程 的 情况 束 是 这 些 ， 下 面 回 到 前 面 ， 看 看 过 程 调 用 是 如 何必 
生 的 。 

代码 清单 8-1 第 24、25 行 ， 用 于 指定 用 户 程序 在 便 盘 上 的 起 始 迎 辑 
扇 区 号 。 我 们 定义 的 过 程 要 求 用 Dll:SI 来 提供 这 个 扇 区 号 ， 既 然 它 是 常数 
100， 很 小 的 数值 ， 可 以 直接 传送 到 寄存 器 Sl， 并 将 DI 清 零 即 可 。 

第 26 行 用 于 指定 存放 数据 的 内 存 地 址 。 前 面 几 条 指令 己 经 将 段 寄 存 
合 DS 设置 好 了 了， 现在 只 需要 将 寄存 右 BX 清 零 ， 以 指 问 该 段 内 偏 移 地 址 
为 0 的 地 方 ， 这 惑 是 当前 指令 要 做 的 事 。 

一 切 都 准备 好 了 ， 和 第 27 行 ， 开 始 调用 过 程 read hard disk 0。 以 
后 ， 我 们 将 把 过 程 所 在 的 标号 做 为 过 程 的 名 字 ， 即 过 程 名 。 


调用 过 程 的 指令 是 “call*"。8086 处 理 器 支持 四 种 调用 方式 。 


第 一 种 是 16 位 相对 近 调 用 。 近 调用 的 意思 是 被 调用 的 目标 过 程 位 
于 当前 代码 段 内 ， 而 非 为 一 个 不 同 的 代码 段 ， 所 以 只 需要 得 到 仿 移 地 址 
可。 


16 位 相对 近 调 用 是 三 字 厄 指令， 操作 人 码 为 0xXE8， 后 跟 16 位 的 操作 
数 ， 因 为 是 相对 调用 ， 故 该 操作 数 是 当前 call 指令 相对 于 目标 过 程 的 偏 移 
量 。 计 算 过 程 如 下 : 用 目标 过 程 的 汇编 地 址 减 去 当前 call 指令 的 汇编 地 
址 ， 再 减 去 当前 call 指令 以 字 贡 为 单位 的 长 度 (3) ， 保 留 16 位 的 结 
举 个 例子 : 


Call neoar proc dd 


近 调 用 的 特征 是 在 指令 中 使 用 关键 字 “near”。"“proc 人 "是 程序 中 的 一 
个 标号 。 在 编译 阶段 ， 编 译 器 用 标号 proc 1 处 的 汇编 地 址 减 去 本 指令 的 
站 编 地 址 ， 再 减 去 3， 作 为 机 器 指令 的 操作 数 。 


关键 字 “near”" 不 是 必需 的 ， 如 果 call 指令 中 没有 提供 任何 关键 字 ， 则 
编译 器 认为 该 指令 是 近 调 用 。 因 此 ， 上 面 的 指令 与 这 条 指令 等 效 : 


call proc | 


因为 16 位 相对 近 调 用 的 换 作 效 是 两 个 汇编 地 址 相 减 的 相对 量 ， 所 
以 ， 如 条 被 调用 过 程 在 当前 指令 的 前 方 ， 也 驶 是 说 ， 论 汇编 地址 ， 它 比 
call 指令 的 要 大 ， 那 么 该 相对 量 和 是 一 个 正 数 ， 反 之 ， 束 是 一 个 负数 。 所 
以 ， 它 的 机 覃 指令 操作 数 是 一 个 16 位 的 有 符号 数 。 换 句 话 说， 航 调 用 过 
程 的 自 地 址 必须 位 于 距离 当前 call 指令 一 32768 一 32767 字 市 的 地 方 。 

在 指令 执行 阶段 ， 处 理 右 看 到 操作 码 0xE8， 融 知 乔 它 应 当 调 用 一 个 
过 程 。 于 是 ， 它 用 指令 指针 寄存 器 IP 的 当前 内 容 加 上 指令 中 的 操作 数 ， 
再 加 上 上 3， 得 到 一 个 新 的 偏 移 地 址 。 接 看 ， 将 IP 的 原 有 内 容 压 入 栈 。 最 
后 ， 用 刚才 计算 出 的 偏 移 地 址 取代 IP 原 有 的 内 容 。 这 直接 导致 处 理 器 的 
执行 流转 移 到 目标 位 置 处 。 


Call Ox03009 


很 多 人 认为 0x0500 会 原封 不 动 地 出 现在 该 指令 编译 后 的 机 器 码 中 ， 
我 相信 这 只 是 他 们 一 时 糊涂 。 在 call 指令 后 跟 一 个 标号 ， 和 中 一 个 数值 没 
有 什么 不 同 。 标 号 是 数值 的 等 价 形式 ， 是 代表 标号 处 的 汇编 地 址 。 在 指 
令 编 译 阶 段 ， 它 首先 会 被 转化 成 数值 。 

所 以 ， 你 在 call 指令 后 跟 一 个 数值 ， 只 是 帮 了 编译 占 的 忙 ， 帮 它 省 了 
一 个 转化 步 台 ， 它 依然 会 用 这 个 数值 减 去 当前 指令 的 汇编 地 址 ， 来 得 到 
一 个 偏 移 量 。 

第 二 种 是 16 位 间接 绝对 近 调 用 。 这 种 调用 也 是 近 调 用 ， 只 能 调用 
当前 代码 段 内 的 过 程 ， 指 令 中 的 操作 数 不 是 偶 移 量 ， 而 是 被 调用 过 程 的 
真实 偏 移 地 址 ， 故 称 为 绝对 地 址 。 不 过 ， 这 个 偏 移 地 址 不 是 直接 出 现在 
指令 中 ， 而 是 由 16 位 的 通用 寄存 右 或 者 16 位 的 内 存单 元 间接 给 出 。 比 
如 : 


call cx ; 目标 地 址 在 cx 中 。 省 略 了 关键 学 “near”， 下 同 


eall 16360005 ; 要 驳 访 问 内 存 才 能 取得 目标 偶 移 地 址 
call [Bx] ; 要 先 访问 内 存 才能 取得 目标 偶 移 地 址 
Eall [Bx+si+0x02] ; 要 先 访问 内 存 才能 取得 目标 偶 移 地 址 


以 上 ， 第 一 条 指令 的 机 器 码 为 FF D1， 被 调用 过 程 的 偏 移 地 址 位 于 寄 
存 器 CX 内 ， 在 指令 执行 的 时 候 由 处 理 器 从 该 寄存 器 取得 ， 并 直接 取代 指 
令 指 针 寄 存 器 IP 原 有 的 内 容 。 

第 二 条 指令 的 机 器 码 为 FF 16 00 30。 当 这 条 指令 执行 时 ， 处 理 器 访 
问 数据 段 〈 使 用 段 寄 存 器 DS) ， 从 偏 移 地 址 0x3000 处 取得 一 个 字 ， 作 
为 目标 过 程 的 真实 偏 移 地 址 ， 并 用 它 取 代 指 令 指针 寄存 器 IP 原 有 的 内 
公 当 

后 面 两 条 指令 没什么 好 说 的 ， 只 是 寻 址 方式 不 同 而 已 。 

间接 绝对 近 调 用 指令 在 执行 时 ， 处 理 器 首先 按 以 上 的 方法 计算 被 调 
用 过 程 的 偏 移 地 址 ， 然 后 将 指令 指针 寄存 器 IP 的 当前 值 压 栈 ， 最 后 用 计 
算出 来 的 偏 移 地 址 取代 寄存 器 IP 原 有 的 内 容 。 


由 于 间接 绝对 近 调 用 的 机 絮 指 令 操 作 数 是 16 位 的 绝对 地 址 ， 因 此 ， 
它 可 以 调用 当前 代码 段 任何 位 置 处 的 过 程 。 

第 三 种 是 16 位 直接 绝对 远 调 用 。 这 种 调用 属于 段 间 调用 ， 即 调用 
另 一 个 代码 段 内 的 过 程 ， 所 以 称 为 远 调 用 (far call) 。 很 容易 想到 ， 远 
调用 既 需 要 被 调用 过 程 所 在 的 段 地 址 ， 也 需要 该 过 程 在 段 内 的 偏 移 地 
址 。 

“16 位 ?是 针对 偶 移 地 址 来 说 的 ， 而 不 是 限定 段 地 址 ， 尽 管 段 地 址 事 
实 上 也 是 16 位 的 ;“ 直 接 ” 的 意思 是 ， 段 地 址 和 偏 移 地 址 直接 在 call 指令 
中 给 出 了 。 当 然 ， 这 里 的 地 址 也 是 绝对 地 址 。 比 如 : 


ealln0x2000:0x0030 


这 条 指令 编译 后 的 机 器 码 为 9A 30 00 00 20，0x9A 是 操作 码 ， 后 面 
跟着 的 两 个 字 分 别 是 偏 移 地 址 和 段 地 址 ， 按 规定 ， 偏 移 地 址 在 前 ， 段 地 
址 在 后 。 


处 理 问 在 执行 时 ， 衣 和 完 将 代码 段 寄存 妖 CS 的 当前 内 容 压 栈 ， 接 看 再 
把 指令 指针 寄存 卓 IP 的 当前 内 容 压 栈 。 案 接 看 ， 用 指令 中 给 出 的 段 地 址 





代替 CS 原 有 的 内 容 ， 用 指令 中 给 出 的 偏 移 地 址 代 普 IP 原 有 的 内 容 。 这 
直接 导致 处 理 器 从 新 的 位 置 开始 执行 。 


处 理 融 症 没 有 脑子 的 。 如 末 被 调用 过 程 位 于 当前 代 担 段 内 ， 而 你 叉 
用 这 种 指令 格式 来 调用 它 ， 那 么 ， 处 理 喜 也 会 不 折 不 扣 地 从 当前 代码 段 
“转移 "到 当前 代 但 段 。 


第 四 种 是 16 位 间接 绝对 远 调 用 。 这 也 属于 段 间 调用 ， 被 调用 过 程 
位 于 男 一 个 代码 段 内 ， 而 且 ， 被 调用 过 程 所 在 的 段 地 址 和 偏 移 地 址 是 间 
接 给 出 的 。 还 有 ， 这 里 的 “16 位 "同样 是 用 来 限定 偏 移 地 址 的 。 下 面 古 这 
种 调用 方式 的 几 个 例子 : 


人 | 

a I 

wall tar TbX| 
[ 


all fark 


间接 远 调 用 必须 使 用 关键 学 “far， 这 一 反 务 必 牢 记 。 


因为 是 远 调用 ， 也 就 古 段 间 调 用 ， 所 以 ， 必 须 给 出 被 调用 过 程 的 段 
地 址 和 偏 移 地 址 。 但 是 ， 段 地 址 和 偏 移 地 址 在 内 存 中 的 其 他 位 兽 ， 指 令 
中 仅仅 给 出 的 是 该 位 置 的 俩 移 地 址 ， 需 要 处 理 堪 在 执行 指令 的 时 候 目 行 
按 图 系 续 ， 找 到 它们 。 


以 上 ， 前 两 条 指令 是 等 效 的 ， 不 同 之 处 仅仅 在 于 ， 第 一 条 指令 直接 
给 出 的 是 数值 ， 而 第 二 条 指令 用 的 是 标号 。 但 这 无 关 紧要 ， 在 编译 后 ， 
标号 也 会 变 成 数值 。 

为 了 进一步 说 清 间接 远 调用 是 怎么 发 生 的 ， 下 面 是 一 个 实例 。 

假如 在 数据 段 内 声明 了 标号 proc_1 并 初始 化 了 两 个 字 : 


proc 1 dw 0x0102,;0x2000 


这 两 个 字 分 别 是 某 个 过 程 的 段 地 址 和 偏 移 地 址 。 按 处 理 器 的 要 求 ， 
偏 移 地 址 在 前 ， 上 段 地 址 在 后 。 也 就 是 说 ，0x0102 是 偏 移 地 址 ; 0x2000 
是 段 地 址 。 


那么 ， 为 了 调用 该 过 程 ， 可 以 在 代码 段 内 使 用 这 条 指令 : 


call tar [pro | 


当 这 条 指令 执行 时 ， 处 理 喜 访问 由 段 寄 存 嚣 DS 指 问 的 数据 上段， 从 指 
令 中 指定 的 偏 移 地 址 (由 标号 proc 1 提供 ) 处 取得 两 个 字 (分 别 是 段 地 
址 0x2000 和 偏 移 地 址 0x0102〉; 接着 ， 将 代码 段 宫 存 右 CS 和 指令 指针 
琳 存 右 IP 的 当前 内 容 分 别 压 栈 : 最 后 ， 用 刚才 取得 的 段 地 址 和 偏 移 地 址 
分 别 取 代 CS 和 IP 的 原 值 。 


至 于 后 面 的 两 条 指令 call far [bx] 和 call far [bx+sil]， 仅 仅 是 寻 址 方式 
上 有 所 区 别 ， 指 令 执 行 过 程 大 体 上 是 一 样 的 。 


接着 回 到 代码 清 持 8-1 第 27 行 ， 很 明显 ， 
call read hard disk 0 


束 是 我 们 刚刚 讲 的 16 位 相对 近 调 用 ， 编 译 后 的 机 器 指令 操作 数 是 一 个 相 
对 偏 移 量 。 由 于 这 是 段 内 调用 ， 处 理 器 执行 这 条 指令 时 ， 用 指令 指针 寄 
存 右 IP 的 内 容 加 上 指令 中 的 偏 移 量 ， 以 及 当前 指令 的 长 上 度 ， 守 出 被 调用 
过 程 的 绝对 偏 移 地 址 。 接 着 ， 将 IP 的 现行 值 压 栈 。 最 后 ， 用 刚刚 计算 出 
的 偏 移 地 址 蔡 代 IP 的 当前 内 容 。 

过 程 read hard disk 0 的 功能 和 工作 流程 前 面 已 经 讲 过 了 ， 不 再 玖 
述 。 这 里 只 关心 一 个 最 重要 的 问题 ， 那 束 古 过 程 返 回 。 

“过 程 " 就 是 例行公事 ， 可 以 随时 根据 需要 调用 ， 但 过 程 执 行 完 了 呢 ， 
还 得 返回 到 调用 点 继续 执行 下 一 条 指令 ， 这 称 为 过 程 返 回 (Procedure 
Return ) 。 

处 理 器 是 个 大 笨重 ， 你 不 提醒 它 ， 它 就 一 直 稀 里 糊涂 地 问 头 工作 。 
对 好 ， 处 理 器 的 发 明 者 们 设计 了 返回 指令 ret 和 retf。 

ret 和 retf 经 常用 做 call 和 call far 的 配对 指令 。ret 是 近 返 回 指 令 ， 当 
它 执 行 时 ， 处 理 絮 只 做 一 件 事 ， 那 就 是 从 栈 中 弹出 一 个 字 到 指令 指针 各 
存 器 IP 中 。 

retf 是 远 返 回 指令 〈return far) ， 它 的 工作 稍微 复杂 一 点 点 。 当 它 执 
行 时 ， 处 理 桥 分 别 从 栈 中 弹出 两 个 字 到 指令 指针 寄存 右 IP 和 代码 段 寄 存 
器 CS 中 。 

如 图 8-14 所 示 ， 在 call read hard disk 0 执行 前 ， 栈 指针 位 于 箭 、 
所 指示 的 位 置 ; call 指令 执行 后 ， 由 于 压 入 了 IP 的 内 容 ， 故 栈 指 针 移 
动 到 箭头 名 所 指示 的 位 置 处 ， 进 入 过 程 后 ， 出 于 保护 现场 的 目的 ， 压 入 


了 4 个 通用 寄存 器 AX、BX、CX、DX， 此 时 ， 栈 指针 继续 向 低地 址 方向 
推进 到 箭头 人 所 指示 的 位 置 。 

在 过 程 的 最 后 ， 是 恢复 现场 ， 连 续 反 序 弹出 4 个 通用 寄存 器 的 内 容 。 
此 时 ， 栈 指针 又 回 到 刚 进 入 过 程 内 部 时 的 位 置 ， 即 葡 头 包 处 。 最 后 ，ret 
指令 执行 时 ， 由 于 处 理 器 目 动 弹出 一 个 字 到 IP， 故 ， 过 程 返回 后 的 瞬 
间 ， 栈 指针 仍旧 回 到 过 程 调 用 前 ， 即 箭头 局 所 指示 的 位 置 。 


内 存 高 地 址 | | 


call 指 令 执 行 前 和 ret 指 @ 
令 执 行 后 的 sp 位 置 ._._._._. 


恢复 现场 后 和 ret 指 令 执 ” ------ 
行 时 的 sp 位 置 


堆栈 推进 方向 + 





保存 现场 后 和 ret 指 令 执 ” ------ 
行 前 的 sp 位 置 


图 8-14 ”过 程 调用 前 后 的 栈 变 化 

南 要 说 明 的 是 ， 尽 管 call 指令 通 津 需要 ret/retf 和 它 配 对 ， 阔 相 呼 
应 ， 但 ret/retf 指令 却 并 不 依赖 于 call 指令 ， 这 一 点 你 马上 就 会 看 到 。 

call 指令 在 执行 过 程 调 用 时 不 影 啊 任何 标志 位 ，ret/retf 指令 对 标志 
位 也 没有 任何 影 啊 。 

检测 点 8.2 

按 题 日 的 要 求 写 出 相应 的 指令 : 

1. 调用 当前 段 内 标号 label proc 处 的 过 程 ; 


2. 调用 当前 段 内 的 过 程 ， 过 程 的 偏 移 地 址 在 寄存 器 BX 中 

3. 调用 当前 段 内 的 过 程 ， 过 程 的 偏 移 地 址 保存 在 当前 数据 段 内 由 知 
存 需 BX 所 指 癌 的 内 存单 元 中 ; 

4. 调用 过 程 ， 过 程 的 段 地 址 为 0xf000， 偏 移 地 址 为 0x0002; 

5. 调用 过 程 ， 过 程 的 段 地 址 和 偏 移 地 址 存放 在 当前 数据 段 内 偏 移 地 
址 为 0x80 的 地 方 ， 低 字 是 过 程 的 侦 移 地 址 ， 高 字 为 过 程 的 段 地 址 ; 

6. 调用 过 程 ， 过 程 的 段 地 址 和 偏 移 地 址 存放 在 当前 数据 段 内 ， 低 字 
为 过 程 的 偏 移 地 址 ， 融 字 为 过 程 的 段 地 址 ， 这 两 个 字 在 当前 数据 段 内 的 
偏 移 地 址 可 以 用 BX+DI+0x08 得 到 。 


8.3.7 ”加 载 用 户 程序 | | 


第 一 众 斌 人 刹 盘 将 得 到 用 户 程 序 最 开 
始 的 512 字 节 ， 这 512 字 节 包括 最 开始 
的 用 户 程 序 头 部 ， 以 及 一 部 分 实际 的 指 





用 户 程序 指令 和 数据 


段 重 定位 表格 







令 和 数据 。 
为 了 将 用 户 程序 全 部 读 入 内 存 ， 需 to 
要 知道 它 的 大 小 ， 然 后 再 进一步 转换 成 ee 


DS 和 ES 


它 所 用 的 局 区 数 。 如 图 8-15 所 示 ， 用 指向 此 有 

户 程 序 最 开始 的 双 字 ， 婚 是 整个 程序 的 

大 小 。 十 0x06 
为 此 ， 人 代码 清单 8-1 第 30、31 Pr 

行 ， 分 别 将 该 数值 的 高 16 位 和 低 16 位 

传送 到 寄存 器 DX 和 AX。 第 32 行 ， 

为 每 而 区 有 512 字 市 ， 故 将 512 传送 到 +ox00 

BX 寄存 器 ， 并 在 第 33 行 用 它 来 做 除法 






入 口 点 所 在 代码 段 
的 汇编 地 址 


入 口 点 : 偏 移 地 址 
一 人 人 


用 户 程序 总 长 度 
运 屏 。 


在 竣 巧 的 情况 下 ， 用 户 程 序 的 大 小 | | 
正好 是 512 的 整数 倍 ， 做 完 除 法 后 ， 在 ”图 8-15 用 户 程 序 关 部 结构 未 意图 
寄存 器 AX 中 是 用 户 程 序 实 际 占用 的 怖 

区 数 。 但 是 ， 绝 大 多 数 情况 下 ， 这 个 除法 会 有 余数 。 有 有 余数 意味 看 ， 最 
后 一 个 届 区 因为 没有 卉 满 而 党 下 了， 没有 纳入 忆 司 区 数 。 





关于 这 个 问题 ， 我 们 稍微 解释 一 下 。 人 硬盘 的 谈 写 是 以 而 区 为 单位 
的 ， 如 果 要 写 入 513 字 节 ， 那 么 ， 它 将 只 能 填 满 一 个 忆 区， 还 剩 一 字 
节 。 硬 盘 不 管 这 些 ， 它 每 次 总 是 说 :“ 来 ， 给 我 512 字 节 ! "为 此 ， 软 件 的 
贡 任 是 ， 保 证 给 硬盘 的 是 512 字 节 ， 如 果 不 够 ， 凑 也 要 凌 够 。 因 此 ，513 
字 节 会 占用 两 个 局 区 ， 第 二 个 而 区 只 有 一 字 节 是 有 用 的 ， 其 他 511 字 节 者 
是 用 来 填充 的 。 至 于 某 个 而 区 里 ， 哪 些 数据 是 有 用 的 ， 哪 些 是 填充 的 ， 
不 是 便 盘 的 贡 任 ， 是 软件 的 黄 任 。 束 像 本 章 的 用 户 程序 一 样 ， 通 过 构造 
一 个 头 部 ， 目 行 来 跟 踩 目 己 的 大 小 。 


所 以 ， 人 代码 清单 8-1 第 34 行 ， 判断 是 否 除 尽 。 如 有 果 没 有 除 尽 ， 则 转 
移 到 后 面 的 代码 ， 去 全 剩 余 的 而 区 ; 如 来 除 尽 了 ， 则 忌 届 区 数 减 一 。 


为 什么 ? 为 什么 除 不 尽 不 管 ， 除 尽 了 还 要 减 一 ? 因为 刚才 已 经 预 读 
下 网 区 ， 


注意 ， 用 户 程 序 的 长 度 有 可 能 小 于 512 字 市 ， 或 者 恰好 每 于 512 字 
方 。 在 这 两 种 情况 下 ， 当 程序 执行 到 第 38 行 时 ， 寄 存 咒 AX 中 的 内 容 必 
然 为 零 。 所 以 ， 第 38 行 是 算术 比较 指令 cmp， 第 39 行 是 条 件 转移 指令 ， 
当 寄 和 存 右 AX 中 的 内 容 为 零 时 ， 融 意味 看 用 户 程序 已 经 全 部 读 取 ， 不 再 继 
续 谈 了 ， 半 葛 用 户 程序 只 后 用 一 个 忆 区 ， 而 刚才 也 已经 访 过 了 。 


用 户 程序 被 加 载 的 位 置 是 由 DS 和 ES 所 指向 的 逻辑 段 。 一 个 逻辑 段 
最 大 也 才 64KB， 当 用 户 程序 特别 大 的 时 候 ， 根 本 容纳 不 下 。 想 想 看 ， 段 
内 偏 移 地 址 从 0x0000 开始 ， 一 直 延 伸 到 最 大 值 0xffff。 再 大 的 话 ， 叉 绕 回 
到 0x0000， 以 至 于 把 最 开始 加 载 的 内 容 给 复 闸 反 了 了 。 

其 实 ， 要 解决 这 个 问题 最 好 的 办 法 是 ， 每 次 往 内 存 中 加 载 一 个 而 区 
前 ， 都 重新 在 前 面 的 数据 尾部 构造 一 个 新 的 逻辑 段 ， 并 把 要 谈 取 的 数据 
加 载 到 这 个 新 段 肉 。 如 此 一 来 ， 因 为 每 个 段 的 大 小 是 512 字 节 ， 即 ， 十 
六 进 制 的 0OXx200， 右 移 4 位 〈 相 当 于 除 以 16 或 者 0x10) 后 是 0x20， 这 如 
是 各 个 段 地 址 之 间 的 兰 值 。 每 次 构造 新 段 时 ， 只 需要 在 前 面 段 地 址 的 基 
人 础 上 增加 0x20 即 可 得 到 新 段 的 段 地 址 。 

这 种 做 法 好 有 一 比 ， 尺 子 很 短 ， 树 很 高 ， 想 只 量 一 次 是 不 可 能 的 ， 
于 是 只 好 分 几 次 量 ， 每 量 一 次 ， 将 尺子 往 下 挪 一 挪 。 

段 地 址 的 改变 是 临时 的 ， 毕 葛 只 是 为 了 读 取 人 硬盘 ， 所 以 ， 代 码 清 单 
8-1 第 42 行 ， 将 当前 数据 段 寄 存 右 DS 的 内 容 压 栈 保存 。 


第 44 行 ， 将 用 户 程序 剩余 的 面 区 数 传 达到 寄存 硕 CX， 供 后 面 的 loop 
指令 使 用 ， 因 为 我 们 准备 采用 循环 的 办 法 来 读 完 用 户 程 序 。 


第 46 一 48 行 ， 将 当前 数据 段 寄 存 嚣 DS 的 内 容 在 原来 的 基础 上 增加 
0x20， 以 构造 出 下 一 个 逻辑 段 ， 为 从 硬盘 上 读 取 下 一 个 512 字 节 的 数据 
做 准备 。 


第 50 行 ， 将 寄存 器 BX 清 零 。BX 被 用 做 数据 传输 时 的 段 内 偏 移 ， 而 
有 旦 每 次 传输 都 是 在 一 个 新 的 段 内 进行 ， 故 偏 移 地 址 在 每 次 传输 前 都 应 当 
是 零 。 

第 51 行 ， 每 次 读 人 硬盘 前 ， 将 寄存 器 Sl 的 内 容 加 一 ， 以 指向 下 一 个 逻 
辑 耐 区。 

第 52 一 53 行 ， 调 用 读 硬 盘 的 过 程 read _ hard disk 0， 并 开始 下 一 轮 
循环 ， 直 到 所 有 的 而 区 都 谈 完 《寄存 髓 CX 的 内 容 为 0) 。 


8.3.8 ”用户 程序 重 定位 


用 户 程序 在 编写 的 时 候 是 分 段 的 。 因 此 ， 加 载 器 下 一 步 的 工作 是 计 
算 和 确定 每 个 段 的 段 地 址 。 


如 图 8-16 所 示 ， 用 户 程序 定义 了 6 个 段 ， 在 编译 阶段 ， 编 译 器 为 每 
个 段 计 算 了 一 个 汇编 地 址 。 第 一 个 段 header 位 于 整个 程序 的 开头 ， 所 以 
其 汇编 地 址 为 0。 从 第 二 个 段 开 始 ， 每 个 段 的 汇编 地 址 都 是 其 相对 于 整个 
程序 开头 的 偏 移 量 ， 以 字 节 为 单位 。 因 为 我 们 不 知道 各 个 段 的 汇编 地 址 
到 撒 是 多 少 ， 故 用 字母 来 表示 。 这 样 ， 第 二 个 段 code_1 的 汇编 地 址 是 
v， 第 三 个 段 code_2 的 汇编 地 址 是 w，..……… ， 最 后 一 个 段 stack 的 汇编 地 
DZ。 


现在 ， 用 户 程序 已 经 全 部 加 载 到 内 存 里 了 ， 而 且 是 从 物理 地 址 
phy_base 开始 的 。 如 此 一 来 ， 每 个 段 在 内 存 中 的 物理 地 址 都 是 基于 
phy base 的 ， 第 一 个 段 header 在 内 存 中 的 起 始 物理 地 址 是 
phy_base (phy base+0) ， 第 二 个 段 在 内 存 中 的 起 始 物理 地 址 是 
phy basetv,...... ， 有 最 后 一 个 段 stack 则 是 phy base+z。 


用 于 加 载 用 户 程 序 的 物理 地 址 phy_base 是 16 字 节 对 齐 的 ， 而 用 户 
程序 中 ， 每 个 段 的 汇编 地 址 也 是 16 字 节 对 齐 的 。 因 此 ， 每 个 段 在 内 存 中 


的 起 始 地 址 也 是 16 字 节 对 齐 的 ， 将 它们 分 别 右 移 4 位 ， 就 是 它们 各 自 的 
逻辑 段 地 址 。 

为 此 ， 人 代码 清单 8-1 第 55 行 ， 从 栈 中 恢复 数据 段 寄 存 器 DS 的 内 容 ， 
使 其 指 同 用 户 程 序 被 加 载 的 起 始 位 置 ， 也 惑 是 用 户 程序 头 部 。 

第 58 一 62 行 用 于 重 定 位 用 户 程序 入 口 点 的 代码 段 。 请 参考 图 8-15， 
用 户 程序 头 部 内 ， 偏 移 为 0x06 处 的 双 字 ， 存 放 的 是 入 口 点 代码 段 的 汇编 
地 址 。 加 载 邦 首 移 将 高 字 和 低 字 分 别传 送 到 寄存 句 DX 和 AX， 然 后 调用 
过 程 calc segment base 来 计算 该 代码 段 在 内 存 中 的 段 地 址 。 


过 程 calc segment_ base 〈 计 算 段 基 址 ) 是 在 代码 清单 8-1 的 第 134 
行 定义 的 。 它 接受 一 个 32 位 的 汇编 地 址 (位 于 寄存 器 DX:AX 中 ) ， 并 在 
计算 完成 后 向 主 程序 返回 一 个 16 位 的 逻辑 段 地 址 (位 于 寄存 器 AX 
中 ) 。 

因为 计算 过 程 中 要 破坏 寄存 器 DX 的 内 容 ， 因 此 ， 第 137 行 用 于 将 其 
压 栈 保存 。 

在 16 位 的 处 理 占 上 ， 每 次 只 能 进行 16 位 数 的 运算 。 第 139 行 ， 先 将 
用 户 程 序 在 内 存 中 物理 起 始 地 址 的 低 16 位 加 到 寄存 器 AX 中 。 访 指令 的 
地 址 部 分 使 用 了 段 超 越前 缀 "cs”， 而 且 也 没有 加 上 0x7c00。 原 因 前 面 已 
经 解释 过 了 ， 在 本 程序 中 ， 数 据 段 和 代码 段 是 分 离 的 ， 而 且 当 前 代码 段 
的 定义 部 分 使 用 了 “vstart=0x7c00” 子 人 句 。 

然后 ， 第 140 行 ， 再 将 该 起 始 地 址 的 高 16 位 加 到 寄存 器 DX 中 。adc 
是 带 进位 加 法 ， 它 将 目的 操作 数 和 源 操 作 数 相 加 ， 然 后 再 加 上 标志 寄存 
器 CF 位 的 值 (0 或 者 1) 。 这 样 ， 分 两 步 就 可 以 完成 32 位 数 的 加 法 运 
全 

现在 ， 我 们 已 经 在 DX:AX 中 得 到 了 入 口 点 代码 段 的 起 始 物理 地 址 ， 
只 需要 将 这 个 32 位 数 右 移 4 位 即 可 得 到 过 辑 段 地 址 。 抹 烦 在 于 它们 分 别 
在 两 个 寄存 占 中 ， 如 何 移动 ? 

答案 是 分 别 移动 ， 然 后 拼接 。 代 码 清 单 8-1 第 141 行 ， 使 用 人 逻辑 厂 移 
指令 shr (SHift logical Right) 将 寄存 器 AX 中 的 内 容 右 移 4 位 。 


| | 内 存 高 地 址 


data 2 
phy base 十 y 

data 1 
phy base 十 X 

COde 2 
phy_base+w 

code 1 
phy base 十 V 

header 
phy_ base 


| | 内 存 低 地 址 


~ 


phy_ base 十 Z 






SECTION header vstart 二 0 







code 1 align 二 16 







code 2 align 二 16 







data_ 1 allgn 王 10 







data 2 allgn 王 10 





SECTION stack allgn 王 10 vstart 一 0 


图 8-16 ”上段 的 偏 移 地 址 和 它 在 内 存 中 的 物理 地 址 


如 图 8-17 所 示 ， 逻 辑 右 移 指 令 执 行 时 ， 会 将 操作 数 连续 地 向 右 移动 
8 定 的 次 数 ， 每 移动 一 次 ，“ 挤 "出 来 的 比特 被 移 到 标志 寄存 器 的 CF 位 ， 
左边 空 出 来 的 位 置 用 比特 “0” 填 充 。 


shr ax , 4 执行 时 


0 

es 
CF 二 最 后 一 个 进 
来 的 比特 my) 


shr 指令 的 目的 操作 数 可 以 是 8 位 或 16 位 的 通用 寄存 器 或 者 内 存 早 
元 ， 源 操作 数 可 以 是 数字 1、8 位 立即 数 或 者 寄存 嚣 CL。 我们 已 经 介绍 过 
寻 址 方式 ， 往 后 ， 我 们 要 用 新 的 方法 来 表示 指令 的 格式 。 融 当前 指令 来 
说 ， 该 指令 的 格式 为 : 


sr /ma 1 ; 目的 操作 数 是 8 位 通用 寄存 器 /内 存单 元 ， 源 操作 数 是 1 

shr T/m16,1 ;目的 操作 数 是 16 位 通用 寄存 器 /内 存单 元 ， 源 操作 数 是 1 

shr r/m8,imm8 ;目的 操作 数 是 8 位 通用 寄存 器 /内 存单 元 ， 源 操作 数 是 8 位 立即 数 
shr r/m16, imm8 ;目的 操作 数 是 16 位 通用 寄存 器 /内 存单 元 ， 源 操作 数 是 8 位 立即 数 





图 8-17 ” 远 辑 右 移 示意 图 


SN ;目的 操作 数 是 8 位 通用 寄存 器 /内 存单 元 ， 源 操作 数 是 寄存 器 CL 
Shr /ml6 cl ;目的 操作 数 是 16 位 通用 寄存 器 /内 存单 元 ， 源 操作 数 是 寄存 器 CL 
以 上 ， 第 一 种 指令 格式 的 意思 是 ， 目 的 操作 数 可 以 是 8 位 寄存 器 ， 或 


者 8 位 的 内 存单 元 ; 源 操作 数 是 1。 对 于 内 存 地 址 的 情况 ， 可 以 使 用 任何 
一 种 我 们 讲 过 的 内 存 寻 址 方式 。 举 三 个 例子 : 


shr Sh 1 
shr Byte [0x20001>,1 
shy bvie [bX+3i+0x02|.,1 


第 二 种 指令 格式 和 第 一 种 相似 ， 只 是 目的 操作 数 的 长 度 不 一 样 。 注 
意 ， 源 操作 数 为 1 的 逻辑 右 移 指令 是 特殊 设计 的 优化 指令 ， 比 如 以 上 的 
shr ax,1， 它 的 机 占 人 友 是 D1 E8; 而 类 似 的 指令 shr ax,5 则 拥有 完全 不 同 
的 机 器 人 码 C1 E8 05。 


第 三 种 指令 格式 的 意思 是 ， 目 的 操作 数 可 以 是 8 位 寄存 左 ， 或 者 8 位 
的 内 存单 元 ; 源 操作 数 是 8 位 立即 数 。 下 面 是 两 个 例子 : 


shr al, 0x20 “有 和 移 32 (0x20) 次 
shr byte [bx+0x06],0x05 ; 右 移 5 次 


第 四 种 指令 格式 和 第 二 种 类 似 ， 只 是 数据 千 度 不 同 。 

第 五 种 指令 格式 的 目的 操作 数 可 以 是 8 位 的 寄存 器 ， 或 者 8 位 的 内 存 
单元 ; 源 操 作 数 在 寄存 器 CL 中 。 如 果 shr 指令 的 源 操作 数 是 寄存 器 ， 则 
只 能 使 用 CL。 和 一 般 的 指令 不 同 ， 宫 存 右 CL 只 用 来 提供 移动 次 数 ， 而 不 
用 于 限定 和 暗示 目的 操作 数 的 字 长 。 因 此 ， 对 于 目的 操作 数 是 内 存 地 址 
的 情况 ， 必 须 用 关键 字 byte 或 者 word 等 来 加 以 限定 。 比 如 : 


shy alscl 


Snr Bvtbe [D1 CL 


最 后 一 种 指令 格式 适用 于 目的 操作 数 的 长 度 为 字 的 情况 。 

注意 ， 和 8086 处 理 器 不 同 ，80286 之 后 的 IA-32 处 理 器 在 执行 本 指 
令 时 ， 会 先 将 源 操 作 数 的 高 3 位 清 零 。 也 就 是 说 ， 最 大 的 移 位 次 数 是 
34 

shr 的 配对 指令 是 逻辑 左 移 指 令 shl (CSHift logical Left) ， 它 的 指令 
格式 和 shr 相同 ， 只 不 过 它 古 同 左 移动 。 


尽管 DX:AX 中 是 32 位 的 用 户 程序 起 始 物理 内 存 地 址 ， 理 论 上 ， 它 只 
有 20 位 是 有 效 的 ， 低 16 位 在 寄存 器 AX 中 ， 高 4 位 在 寄存 器 DX 的 低 4 
位 。 寄 存 器 AX 经 右 移 后 ， 高 4 位 已 经 空 出 ， 只 要 将 DX 的 最 低 4 位 挪 到 
这 里 ， 就 可 以 得 到 我 们 所 需要 的 逻辑 段 地 址 。 为 此 ， 可 以 使 用 以 下 指 


shl dx,12 


Or ax ,dx 


很 显然 ， 代 码 清 时 8-1 并 不 是 这 么 做 的 ， 为 的 是 演示 男 一 个 不 同 的 指 
令 ror (第 142 行 ) ， 也 惑 是 循环 右 移 CROtate Right) 。 如 网 8-18 所 
示 ， 循 环 右 移 指令 执行 时 ， 每 右 移 一 次 ， 移 出 的 比特 既 送 到 标志 寄存 器 
的 CF 位 ， 也 送 进 左边 空 出 的 位 。 


ror 的 配对 指令 是 循环 左 移 指令 rol (ROtate Left) 。ror、rol、shl、 
shr 的 指令 格式 都 是 相同 的 。 


因为 是 循环 移 位 ， 移 位 后 ， 和 寄存 右 DX 的 低 12 位 是 我 们 不 需要 的 。 
所 以 ， 代 码 清单 8-1 的 第 143 行 ， 用 and 指令 将 其 清 零 。 


第 144 行 ， 正 式 将 寄存 器 AX 和 DX 的 内 容 合 并 ， 这 就 是 我 们 要 的 段 
地 址 。 


过 程 的 最 后 ， 第 146 一 148 行 ， 恢 复 寄 存 磺 DX 的 原始 内 容 ， 并 返回 
到 调用 程序 那里 。 


现在 ， 回 到 代码 清单 8-1 的 第 62 行 ， 那 条 指令 的 功能 是 将 刚刚 计算 
出 来 的 逻辑 段 地 址 回 写 到 原 处 ， 仪 窗 击 低 16 位 ， 局 16 位 不 用 理会 。 


ror dx . 4 执行 时 





图 8-18 ”循环 右 移 示意 图 


现在 仅仅 是 处 理 了 入 口 点 代码 段 的 重 定位 ， 下 面 开 始 正 陈 处 理 用 户 
程序 的 所 有 段 ， 它 们 位 于 用 户 程序 头 部 的 段 重 定位 表 中 。 

竺 定位 表 的 表 项 数 和 存放 在 用 户 程 序 尖 部 仿 移 0x0a 处 ， 如 图 8-5 所 
示 。 人 代码 清单 8-1 第 65 行 ， 用 于 将 它 从 该 内 存 地 址 处 传 过 到 寄存 絮 CX， 
供 后 面 的 循环 指令 使 用 。 


段 午 定位 表 的 首 地 址 存放 在 用 户 程 序 头 部 偏 移 0x0c 处 ， 因 此 ， 第 66 
行 ， 将 0x0c 传送 到 其 址 寄存 器 BX 中 。 以 后 ， 每 次 只 要 将 BX 的 内 容 加 上 
4， 束 指 癌 下 一 个 重 定位 表 项 。 


第 68 一 74 行 是 循环 体 ， 每 次 循环 开始 后 ，BX 总 是 指 癌 需要 重 定 位 
的 段 的 汇编 地 址 ， 而 且 都 是 双 字 ， 需 要 分 别传 送 到 寄存 需 DX 和 AX。 然 
后 调用 过 程 calc segment _ base 计算 相应 的 逻辑 段 地 址 ， 并 获 凋 到 原来 
的 位 置 〈 低 字 ) ， 最 后 将 基 址 寄存 器 的 内 容 加 上 4 ， 以 指 癌 下 一 个 表 项 。 
当 寄 存 右 CX 的 内 容 为 0 时 ， 循 环 结束 ， 所 有 的 段 都 处 理 完 毕 。 


8.3.9 将 控制 权 交 给 用 户 程序 


现在 ， 用 户 程 序 已 经 在 内 存 中 谁 备 束 绪 ， 剩 下 的 工作 束 定 把 处 理 需 
的 控制 权 交 给 它 。 交 接 工 作 很 人 镜 单 ， 代 人 码 清和 早 8-1 第 76 行 ， 加 载 厅 通过 
一 个 16 位 的 同 接 绝对 远 转 移 指令 ， 跳 棱 到 用 户 程 序 入 口 点 。 

如 图 8-15 所 示 ， 入 口 点 是 两 个 连续 的 字 ， 低 字 是 仿 移 地 址 ， 位 于 用 
户 程序 头 部 内 俩 移 为 0x04 的 地 方 ; 高 字 征 段 地 址 ， 位 于 用 户 程 序 头 部 内 
仿 移 为 0x06 的 地 方 。 而 且 ， 因 为 加 载 套 的 羡 勤 工作 ， 访 段 节 址 是 已 经 重 
定位 过 的 。 

处 理 右 执行 指令 


]mp far [Ox04] 


时 ， 会 访问 段 寄 存 缉 DS 所 指 同 的 数据 段 ， 从 偏 移 地 址 为 0x04 的 地 方 取 
出 两 个 字 ， 并 分 别传 送 到 代码 段 寄 存 右 CS 和 指令 指针 寄存 器 IP， 以 蔡 代 
它们 原先 的 内 容 。 于 是 ， 人 处 理 器 就 像 被 洗脑 了 一 样 ， 上 自行 转移 到 指定 的 
位 置 处 开始 执行 。 

处 理 器 已 经 跑 到 用 户 程序 内 部 去 执行 了 ， 所 以 接 下 来 的 工作 是 跟踪 
用 户 程 序 的 工作 流程 。 不 过 ， 在 此 之 前 ， 还 是 先 总 结 一 下 无 条 件 转移 指 
令 jmp 的 用 法 。 


8.3.10 ”8086 处 理 器 的 无 条 件 转移 指令 


1. 相对 短 转移 

相对 短 转 移 的 操作 码 为 0xXEB， 操 作 数 是 相对 于 目标 位 置 的 偏 移 量 ， 
仅 1 字 节 ， 是 个 有 符号 数 。 由 于 这 个 原因 ， 访 指令 属于 段 内 转移 指令 ， 而 
且 只 人 允许 转移 到 距离 当前 指令 -128 一 127 字 节 的 地 方 。 相 对 短 转移 指令 
必须 使 用 关键 字 “short"。 例 如 ; 


Jmp. Short 4nfinlte 


在 产程 序 编 详 阶 段 ， 编 详 苍 会 检 碍 标志 infinite 所 代表 的 值 ， 如 打数 
值 超 过 了 一 字 节 所 能 允许 的 数值 范围 ， 则 无 法 通过 编 详 。 人 否则 ， 编 详 需 


用 目标 位 置 的 汇编 地 址 减 去 当前 指令 的 汇编 地 址 ， 再 减 去 当前 指令 的 长 
度 〈2) ， 保 留 1 字 市 的 结果 ， 作 为 机 右 指 令 的 操作 数 。 

相对 短 转 移 指令 的 汇编 语言 操作 数 只 能 是 标号 和 数值 。 下 面 是 耳 接 
使 用 数值 的 情况 : 


me short 0X2000 


但 数值 和 标 写 是 等 价 的 。 在 编 详 阶段， 部 匀 用 来 计算 一 个 8 位 的 仿 移 


里 。 


在 指令 执行 时 ， 处 理 右 把 指令 中 的 操作 数 加 上 2， 再 加 到 指令 指针 寄 
存 占 IP 上 ， 这 会 导致 指令 的 执行 流程 转 癌 目标 地 址 处 。 


2. 16 位 相对 近 转 移 


和 相对 短 转移 不 同 ，16 位 相对 近 转 移 指令 的 转移 范围 稍 大 一 些 。 
的 机 侣 指令 操作 人 码 为 0xXE9， 而 且 ， 该 指令 的 长 度 为 3 字 市 ， 操 作 人 码 0xE9 
后 面 还 有 一 个 16 位 (2 字 节 ) 的 操作 数 。 


因为 是 近 转 移 ， 故 其 属于 段 内 转移 。 "相对 "的 意思 同样 是 指 它 的 操作 
数 是 一 个 相对 量 ， 是 相对 于 目标 位 置 处 的 偏 移 量 。 在 源 程序 编译 阶段 ， 
编译 占用 日 标 位 置 的 汇编 地 址 减 去 当前 指令 的 汇编 地 址 ， 再 减 去 当前 指 
令 的 长 上 度 (3) ， 保 留 16 位 的 结果 ， 作 为 机 器 指令 的 操作 数 。 由 于 这 是 
一 个 16 位 的 有 符号 数 ， 故 可 以 转移 到 距离 当前 指令 -32768 一 32767 字 节 
的 地 方 。 


16 位 相对 近 转 移 指令 应 当 使 用 关键 字 “near”， 比 如 


Jmp near infinite 


Jmp near Ox3000 


在 早先 的 NASM 版 本 中 ， 关 键 字 near 是 可 以 省 略 的 。 知 没有 指定 
short 或 者 near， 那 么 ， 编 译 需 目 动 默认 是 “near 的 。 但 是 最 近 的 版 本 改 
变 了 这 一 规则 。 如 果 没 有 指定 关键 字 short 或 者 near， 那 么 ， 如 果 目 标 位 
置 距离 当前 指令 -128 一 127 字 节 ， 则 目 动 采用 short; 含 则 ， 采 用 near。 


3. 16 位 间接 绝对 近 转 移 


这 种 转移 方式 也 征 近 转移 ， 即 只 在 段 内 转移 。 但 是 ， 转 移 到 的 目标 
偏 移 地 址 不 是 在 指令 中 和 卫 接 给 出 的 ， 而 是 用 一 个 16 位 的 退 用 寄存 右 或 者 
内 存 地 址 来 间接 给 出 的 。 比 如 : 


jmp near bx 


jmp near cx 
指令 中 的 关键 字 “near" 可 以 省 略 ， 间 接 绝 对 近 转 移 原本 就 是 near 
的 。 以 上 两 条 指令 执行 时 ， 处 理 器 将 用 寄存 器 BX 或 者 CX 的 内 容 来 取代 
指令 指针 寄存 器 IP 的 当前 内 容 。 
以 上 是 目标 偏 移 地 址 位 于 通用 寄存 器 的 情况 。 当 然 ， 访 偏 移 地 址 也 
可 位 于 内 存 中 ， 而 且 这 是 最 第 见 的 情况 。 假 如 在 菜 程序 的 数据 段 中 声明 
了 标号 jump_dest 并 初始 化 了 一 个 字 : 


Jump dest, dw 0Xc000 


而 且 假定 我 们 已 经 知道 它 是 转移 目标 的 起 始 俩 移 地 址 ， 那 么 ， 在 该 
程序 的 代码 段 内 ， 束 可 以 使 用 以 下 的 16 位 间接 绝对 近 转 移 指令 : 


jmp [jump dest] :省略 关 键 字 “near”， 本 小 节 内 下 同 


当 这 条 指令 执行 时 ， 处 理 器 访问 由 段 寄 存 器 DS 指 回 的 数据 段 ， 从 指 
令 中 指定 的 偏 移 地 址 处 取得 一 个 字 【〈 在 这 里 是 0xc000) ， 并 用 该 字 取代 
指令 指针 寄存 器 IP 的 当前 内 容 。 

当然 ， 既 然 是 间接 地 寻找 目标 位 置 的 偏 移 地 址 ， 其 他 寻 址 方式 也 是 
可 以 的 。 比 如 : 


jmp [bx] 
Jmp [bxtsi] 


注意 ，jmp bx 和 jmp [bx] 是 完全 不 同 的 ， 不 要 犯 迷 糊 。 前 者 ， 要 转移 
的 绝对 仿 移 地 址 位 于 寄存 器 BX 中 ; 后 者 ， 偏 移 地 址 位 于 由 BX 所 指 问 的 
内 存 字 单元 中 。 

4. 16 位 直接 绝对 远 转 移 

很 早 以 前 ， 我 们 曾经 见 过 这 样 的 指令 : 


jmp 0x0000:0x7c00 


在 这 里 ，0x0000 和 0x7c00 分 别 是 段 地 址 和 偏 移 地 址 ， 符 合 “ 段 地 
址 : 偏 移 地 址 ”的 表达 习惯 。 在 编译 之 后 ， 其 机 器 指令 为 


EA O00 1c 00 00 


0xEA 是 操作 码 ， 后 面 是 操作 数 。 注 意 ， 字 的 存放 是 按照 低 端 字 节 序 
的 。 而 且 ， 在 编译 之 后 ， 偏 移 地 址 在 前 ， 段 地 址 在 后 。 执 行 这 条 指令 
后 ， 处 理 器 用 指令 中 给 出 的 段 地 址 代 蔡 段 寄 存 器 CS 的 原 有 内 容 ， 用 给 出 
的 仿 移 地 址 代 蔡 IP 寄存 颖 的 原 有 内 容 ， 从 而 跳 转 到 为 一 个 不 同 的 代码 段 
中 ， 即 执行 一 个 段 间 转移 。 

像 这 种 直接 在 指令 中 给 出 段 地 址 和 偏 移 地 址 的 转移 指令 ， 就 是 直接 
绝对 远 转 移 指令 。 "16 位 " 仪 仅 用 来 限定 偏 移 地 址 部 分 ， 指 偏 移 地 址 是 16 
位 的 。 

5. 16 位 间接 绝对 远 转 移 〈jmp far) 


还 转移 的 目标 地 址 可 以 通过 访问 内 存 来 间接 得 到 ， 这 叫 间 接 远 转 
移 ， 但 征 要 使 用 关键 字 "*far 。 假 如 在 茶 程 序 的 数据 段 内 声明 了 标号 
jump_far， 并 在 其 后 初始 化 了 两 个 字 : 


Jump Ear dw 0x33c0, 0xf000 


这 不 是 两 个 普通 的 数值， 它们 分 别 是 东 个 程序 万 断 的 俩 移 地 址 和 段 
地 址 。 为 了 转移 到 该 程序 片断 上 执行 ， 可 以 和 在 使 用 下 面 的 转移 指令 : 


]Jmp far [jump far] 
天 键 字 "far 的 作用 是 告诉 编译 医 ， 访 指令 应 当 编 译 成 一 个 远 转 移 。 处 
理 问 执行 这 条 指令 后 ， 访 问 段 寄 存 器 DS 所 指 问 的 数据 段 ， 从 指令 中 给 出 
的 偶 移 地 址 处 取出 两 个 字 ， 分 别 用 来 蔡 代 段 寄 存 蓝 CS 和 指令 指针 寄存 堪 
IP 的 内 容 。 


其 实 ， 最 好 的 例子 还 是 本 章 代 码 清单 8-1 的 第 76 行 : 
Jmp far [Ox04] 


16 位 间接 绝 对 远 转 移 指 令 的 操作 数 可 以 古 任何 一 种 内 存 寻 址 方式 。 
除了 了 上面 的 例子 外 ， 下 面 青 给 出 儿 个 : 


mp tar [BX| 


ms fa [LDN+SL| 


最 后 ,，“16 位 "的 章 轧 是， 要 转移 到 的 目标 位 置 的 俩 移 地 址 是 16 位 
的 。 


检测 点 8.3 

1. 以 下 指令 执行 后 ， 寄 人 存 左 AX 中 的 内 容 古 多 少 ? 
moVv ax,0xbaa 
ror ax,38 
shr ax,2 

投 题 目的 要 求 写 出 相应 的 指令 : 

无条件 转移 到 当前 段 内 标号 label_proc 处 ; 


b. 无 条 件 转 移 到 当前 段 内 的 男 一 个 位 置 ， 偏 移 地 址 在 寄存 器 BX 
中 ; 

c. 无 条 件 转 移 到 当前 段 内 的 男 一 个 位 置 ， 偏 移 地 址 保存 在 当前 附加 
段 内 由 寄存 器 BX 所 指 问 的 内 存单 元 中 ; 

d. 无 条 件 转移 ， 段 地 址 为 0xf000， 偏 移 地 址 为 0x0002; 

e. 无 条 件 转移 ， 段 地 址 和 偏 移 地 址 存放 在 当前 数据 段 内 偏 移 地 址 为 
0x80 的 地 方 ， 低 字 是 目标 处 的 偏 移 地 址 ， 高 字 为 目标 处 段 地 址 ; 


f， 无 条 件 转 移 ， 段 地 址 和 偏 移 地 址 存放 在 当前 附加 段 内 ， 低 字 为 目 
标的 偏 移 地 址 ， 融 字 为 目标 的 段 地 址 ， 这 两 个 字 在 当前 附加 段 内 的 偏 移 
地 址 可 以 用 BX+DI+0x08 得 到 。 


Be 
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8.4 用户 程序 的 工作 流程 


8.4.1 初始 化 段 寄 存 器 和 栈 切换 


现在 轮 到 用 户 程 序 在 处 理 桌 上 执行 了 。 


用 户 程序 的 入 口 点 在 代码 清单 8-2 的 第 135 行 。 因 为 加 载 器 已 经 完成 
了 重 定 位 工作 ， 所 以 用 户 程 序 的 头等 大 事 是 初始 化 处 理 硕 的 各 个 段 寄 人 存 
名 DS、ES、SS， 以 便 访 问 专 属于 目 己 的 数据 。 段 寄存 右 CS 束 不 用 初始 
化 了 ， 那 是 加 载 占 负 贡 做 的 事 。 要 不 然 用 户 程 序 怎 么 可 能 执行 呢 ，。 


在 刚刚 进入 用 户 程序 时 ， 段 寄存 器 DS 和 ES 依然 指 问 段 header， 而 
栈 段 寄存 器 SS 依然 指 癌 加 载 右 的 栈 空间 。 人 代码 清单 8-2 的 第 137、138 
行 ， 用 于 从 头 部 取得 用 户 程 序 上 自己 的 栈 段 的 段 地 址 ， 并 传送 到 段 寄 存 器 
SS 中 。 

第 139 行 ， 将 标号 stack_end 所 代表 的 数值 传送 到 栈 指 针 寄 存 髓 
SP。 该 标号 是 在 第 205 行 声明 的 ， 在 它 的 前 面 ， 是 伪 指 令 resb， 用 来 保 
留 256 字 节 的 栈 空间 。 

伪 指 令 resb (REServe Byte) 的 意思 是 从 当前 位 置 开 始 ， 保 留 指定 
数量 的 字 节 ， 但 不 初始 化 它们 的 值 。 在 源 程 序 编译 时 ， 编 译 器 会 保留 一 
段 内 存 区 域 ， 用 来 存放 编译 后 的 内 容 。 当 它 看 到 这 条 伪 指 令 时 ， 它 仅仅 
是 跳 过 指定 数量 的 字 节 ， 而 不 管 里 面 的 原始 内 容 是 什么 。 内 存 是 反复 使 
用 的 ， 谁 也 无 法 知道 以 前 的 使 用 者 在 这 里 留 下 了 什么 。 也 束 是 说 ， 跳 过 
的 这 上 段 空 间 ， 每 个 字 市 的 值 是 不 确定 的 。 

因此 ， 


resb 256 


将 在 编译 后 的 内 容 中 保留 256 字 节 。resb 不 是 唯一 用 来 声明 未 初始 
化 数据 的 指令 。 以 下 是 为 外 一 些 : 


resw 100 ;声明 100 个 未 初始 化 的 孚 
resd 50 ;声明 50 个 未 初始 化 的 双 字 


栈 段 stack 的 定义 中 有 “vstart=0” 子 句 ， 保 留 的 256 字 节 ， 其 汇编 地 址 
分 别 是 0 一 255。 所 以 ， 标 号 stack_end 处 的 汇编 地 址 实际 上 是 256。 也 就 
是 说 ， 代 码 请 单 8-2 的 第 139 行 和 以 下 指令 等 价 : 


moOY 人 25 


栈 切 换 完 毕 之 后 ， 第 141、142 行 ， 从 用 户 程 序 头 部 取得 数据 段 
data 1 的 段 地 址 ， 传 送 到 段 寄 存 郁 DSS 中。 从 此 ，DS 不 再 指 同 段 
header， 不 能 再 用 它 访 问 用 户 程序 头 部 了 。 

据 此 也 可 以 看 出 ， 各 个 段 守 和 存 右 的 初始 化 顺序 很 重要 。 如 果 先 初始 
化 数据 段 和 附加 段 ， 那 么 ， 段 header 中 的 数据 将 无 法 访问 。 


8.4.2 调用 字符 串 显示 例 程 


紧 接着， 用 户 程 序 要 在 屏 和 名 上 显示 东西 了 。 

要 显示 的 内 容 位 于 段 data_ 1 中 ， 该 段 当 前 正 由 段 寄 存 器 DS 指向 。 
代码 清单 8-2 第 175 行 ， 声 明了 标号 msg0 并 初始 化 了 一 大 堆 字 人 符 。 当 
然 ， 因 为 字符 太 多 ， 行 太 长 ， 而 我 们 还 想 能 大 人 致 “ 看 ”到 显示 效果 ， 所 以 分 
成 了 多 行 来 初始 化 。 

为 太 长 的 行使 用 续 行 符 玉 当然 是 一 个 好 主意 ， 不 过 我 们 现在 的 做 法 
是 将 太 长 的 行 分 成 几 段 ， 分 别 用 伪 指 令 db 来 初始 化 。 在 编译 之 后 ， 它 们 
仍然 是 紧 控 在 一 起 的 ， 可 以 用 唯一 的 标 写 msg0 来 引用 。 

在 屏幕 上 显示 字符 ， 所 做 的 仅仅 是 填充 显存 ， 只 要 所 填充 的 内 容 不 
超过 一 屏 所 能 显示 的 字符 数 ， 其 他 的 事 不 需要 你 操心 。 当 字符 在 一 行 上 
显示 不 下 时 ， 显 示 系 统 会 日 动 移 到 下 一 行 接 大 显示 ， 这 也 和 你 无 天 。 

不 过 ， 有 时 候 我 们 硕 望 有 目 行 换行 的 能 力 ， 而 不 管 那 一 行 是 否 已 经 
到 汰 ( 屏 大 最 右边 ) 。 这 么 做 的 目的 通常 是 用 来 格式 化 文本 段落 。 

再 来 回顾 一 下 ASCI 码 。 在 128 个 ASCI 代码 中 ， 大 部 分 是 可 显示 和 
打印 的 字符 ， 还 有 一 部 分 用 于 控制 显示 和 打印 那些 字符 的 设备 。 比 如 
Ox0Od 是 回 车 ， Ox0a 是 换行 。 

回 车 和 换行 的 概念 最 早起 源 于 老式 打字 机 。 那 种 打字 机 上 有 深 价 ， 
用 于 使 纸张 上 下 卷 动 ， 每 顾 击 一 个 按键 ， 字 车 往 右 移动 一 格 ， 位 于 下 一 
个 可 打印 的 位 置 。 在 这 种 古老 而 不 失 先 进 性 的 设备 上 ， 将 字 车 推 到 最 左 


， 也 就 是 一 行 的 开始 ， 叫 做 回 车 〈Carriage Return ) ;而 拧 一 下 滚 
简 ， 将 纸 上 卷 一 行 ， 叫 做 换行 (Line Feed) 。 如 果 既 回 车 ， 又 换行 ， 那 
么 ， 字 和 车 将 位 于 下 一 行 的 行 首 。 这 个 过 程 通 种 叫做 回 车 换行 (CRLF) 。 

在 刚刚 有 了 电子 计算 机 的 时 候 ， 因 为 它 又 大 又 贵 ， 只 能 通过 远程 终 
端 来 分 享 它 的 计算 能 力 。 这 时 候 ， 用 的 是 电 传 打字 机 ， 不 需要 人 工 操作 
即 可 显示 和 打印 字符 。 当 然 ， 根 据 需 要 随时 加 车 换行 还 是 需要 的 。 怎 么 
办 ? 那 束 是 用 ASCIl 码 中 的 控制 字符 来 命令 电 传 打字 机 来 做 这 件 事 。 不 
知 怎么 回 事 ， 回 车 分 配 的 ASCI 码 是 0x0d， 换 行 分 配 的 则 是 0x0a。 奇 怪 
吗 ? 没什么 好 奇怪 的 。 

在 个 人 计算 机 时 代 ， 为 了 在 屏幕 上 显示 字符 ，ASCI 码 也 被 引入 显 
示 系 统 。 不 过 ， 当 我 们 加 显存 里 写 入 0x0d 和 0x0a 时 ， 并 不 起 任何 作 
用 ， 也 没有 任何 效果 ， 没 有 任何 人 硬件 对 解释 它们 的 意义 负责 。 不 过 无 所 
谓 ， 对 回 车 换行 代码 的 解释 可 以 由 我 们 目 己 负责 ， 现 在 所 要 做 的 ， 就 是 
在 字符 串 中 ， 需 要 回 车 换行 的 地 方 按照 老 传 统 搬 入 这 两 个 代码 。 


正 是 由 于 以 上 的 原因 ， 在 代码 清单 8-2 的 第 175 一 191 行 ， 凡 是 需要 
回 车 换行 的 地 方 ， 都 使 用 了 0x0d 和 0x0a。 而 且 ， 在 第 191 行 ， 也 就 是 所 
有 要 显示 内 容 最 后 ， 是 数值 0， 用 来 标志 字符 串 的 结束 ， 这 样 的 字符 串 称 
为 是 0 终止 的 字符 串 ， 在 高 级 语言 里 经 名 使 用 。 


段 data_1 的 定义 中 包括 “vstart=0” 子 句 ， 故 标号 msg0 的 汇编 地 址 是 
从 该 段 的 起 始 处 《0) 开始 计算 的 。 代 码 清单 8-2 的 第 144、145 行 ， 将 
该 字符 串 的 偏 移 地 址 传送 到 基 址 寄存 器 BX， 并 调用 过 程 put_string。 


8.4.3 ”过程 的 散 套 


过 程 put_string 是 在 当前 代码 段 定 义 的 ， 位 于 代码 清单 8-2 的 第 28 
行 ， 用 于 显示 给 定 的 字符 串 。 它 接受 两 个 参数 DS 和 BX， 分 别 是 字符 串 
所 在 的 段 地 址 和 偏 移 地 址 。 男 外 ， 它 要 求 字 符 串 的 最 后 一 个 数值 是 0， 作 
为 终止 的 标记 。 

过 程 put_string 的 工作 很 简单 ， 它 循环 从 DS:BX 中 取得 单个 字符 ， 
判断 它 是 否 为 0。 不 为 0 则 调用 男 一 个 过 程 put_char， 为 0 则 返回 主 程 
序 。 

为 此 ， 人 代码 清单 8-2 第 30 行 ， 从 当前 数据 段 中 取得 一 个 字符 ， 段 地 
址 在 DS 中 ， 偏 移 地 址 由 BX 提供 。 


由 


第 31 行 ， 通 过 or 指令 来 促成 标志 的 产生 ， 它 的 功能 类 似 于 
cmp cl,0 


在 这 里 ，or 指令 的 两 个 操作 数 相 同 ， 都 是 寄存 右 CL， 一 个 数 和 它 目 
己 做 “或 运算， 结果 还 是 它 自己 ,但 计算 结果 会 影响 标志 寄存 器 中 的 某 些 
位 。 如 果 ZF 置 位 ， 说 明 取 到 了 串 结 束 标 志 0， 转 移 到 第 38 行 返 回 主 程 
序 ; 人 否则， 将 取 到 的 字符 作为 参数 调用 另 一 个 过 程 put_char。 


当 过 程 put_char 返回 后 ， 第 34 行 ， 将 寄存 硕 BX 的 内 容 加 一 以 指 问 
下 一 个 要 显示 的 字符 。 

第 35 行 ， 无 条 件 转移 到 当前 过 程 的 开始 处 ， 重 复 取 字符 过 程 。 

允许 在 一 个 过 程 中 调用 为 一 个 过 程 ， 这 称 为 过 程 舱 僚 。 因 为 每 次 调 
用 过 程 时 ， 处 理 占 部 把 返回 地 址 压 在 栈 中 ， 人 返回 时 从 栈 中 取得 返回 地 
址 ， 所 以 ， 只 要 栈 是 安全 的 ， 角 僚 的 过 程 虱 能 层 层 返回 。 

过 程 欧 和 套 的 层 数 在 原则 上 十 没有 限制 的 ， 唯 一 的 限制 是 栈 的 六 小 。 
不 要 万 了 ， 实 模式 下 ， 栈 的 空间 最 大 古 64KB， 每 执行 一 次 过 程 调用 第 要 
2 字 市 或 4 字 节 ， 这 还 没有 包括 在 每 个 过 程 内 部 消耗 的 栈 空间 。 


8.4.4 屏幕 光标 控制 


过 程 put_char 用 于 显示 一 个 字 从 。 但 它 与 第 规 方法 的 不 同 之 处 在 
于 ， 它 能 判断 回 车 和 换行 ， 还 能 在 超过 屏幕 上 最 后 一 行 的 时 候 上 滚 内 
窑 ， 就 是 我 们 经 党 说 的 卷 屏 或 者 深 屏 。 除 此 之 外 ， 它 还 使 用 了 光标 跟随 
技术 。 

光标 (Cursor) 是 在 屏幕 上 有 规律 地 内 动 的 一 条 小 横 线 ， 通 稼 用 于 
指示 下 一 个 要 显示 的 字符 位 置 ， 这 对 很 多 年 龄 比较 大 的 人 来 说 很 熟悉 
(前 提 是 他 们 以 前 也 用 过 计算 机 ) 。 在 那个 时 代 ， 还 没有 基于 图 形 显 示 
技术 的 Windows， 上 所 有 的 软件 都 在 文本 模式 下 工作 ， 而 基于 硬件 的 光标 
只 在 文本 模式 下 才 会 出 现 。 

计算 机 技术 发 展 得 很 快 ， 很 多 硬件 都 已 经 或 者 即将 淘汰 ， 但 最 卡 是 
个 例外 。 即 使 是 现在 ， 多 年 前 形成 的 VGA 显示 标准 在 每 块 显卡 中 都 完好 
地 保留 下 来 了 了， 包括 对 光标 的 支持 。 原 因 很 简单 ， 在 显卡 中 集成 一 块 支 
持 128 个 ASCI 代码 的 字符 发 生 器 非常 方便 ， 在 程序 中 显示 一 个 字符 也 只 


要 给 出 它 的 ASCI 人 码 。 显 示 图 形 的 代价 太 大 ， 在 计算 机 加 电 局 动 的 时 
修 ， 以 及 其 他 一 些 根本 没 必要 、 也 没 条 件 使 用 图 形 柑 式 的 场合 ， 这 是 最 
好 的 选择 。 

光标 在 屏幕 上 的 位 置 你 存在 显卡 内 部 的 两 个 光标 寄存 此 中 ， 每 个 寄 
人 存 融 是 8 位 的 ， 合 起 来 形成 一 个 16 位 的 数值 。 比 如 ，0 表示 光标 在 屏 笑 
上 第 0 行 第 0 列 ，80 表示 它 在 第 1 行 第 0 列 ， 因 为 标准 VGA 文本 模式 十 
25 行 ， 每 行 80 个 字符 。 这 梓 算 来 ， 当 光标 在 屏 妖 在下 角 时 ， 访 全 为 25x 
80 一 1=1999 。 

光标 寄存 右 是 可 谈 可 与 的 。 你 可 以 从 中 读 出 光标 的 位 置 ， 也 可 以 通 
过 它 设 置 光 标的 位 置 。 能 够 通过 写 入 一 个 数值 来 设 定 光 标的 位 置 ， 这 不 
是 恩赐 ， 而 是 贡 任 ， 因 为 显卡 从 来 不 目 动 移动 光标 位 置 ， 这 个 任务 是 你 
的 。 现 在 你 总 算 明 日 为 什么 它 和 是 可 与 的 了 吧 ? 


8.4.5” 取 当前 光标 位 置 


显卡 的 操作 非常 复杂 ， 内 部 的 寄存 器 也 不 是 一 般 地 多 。 为 了 不 过 多 
占用 主机 的 I/O 衬 间 ， 很 多 寄存 器 只 能 通过 索引 寄存 器 间接 访问 。 

索引 寄存 器 的 端口 号 是 0x3d4， 可 以 同 它 写 入 一 个 值 ， 用 来 指定 内 部 
的 某 个 寄存 器 。 比 如 ， 两 个 8 位 的 光标 寄存 器 ， 其 索引 值 分 别 是 
14 (0x0e) 和 15 (0x0f) ， 分 别 用 于 提供 光标 位 置 的 高 8 位 和 低 8 位 。 

和 定 了 寄存 器 之 后 ， 要 对 它 进行 读 写 ， 这 可 以 通过 数据 端口 0x3d5 
来 进行 。 

好 ， 现 在 言 归 正 传 。 过 程 put_char 看 起 来 并 不 太 复 杂 ， 但 实际 上 浏 
有 晰 和 分 文 较 多 。 为 了 便于 读者 理解 这 段 代 码 ， 也 为 了 方便 讲解 ， 网 8-19 
给 出 了 它 的 工作 流程 图 。 


过 程 开 始 
相关 寄存 器 压 栈 保护 
取 当 前 光标 位 置 


显示 的 字符 是 0x0d? 
否 


.put 0a 


显示 的 字符 是 0x0a? 


.put_ other 








计算 光标 在 当前 行 行 计算 光标 在 下 一 行当 
首 时 的 位 置 数值 前 列 时 的 位 置 数值 


在 光标 处 显示 字符 并 
推进 光标 位 置 


Toll] Screen 
光标 位 置 超 界 ? 一 
轩 


.Set CUTSOT 


重新 设置 光标 


相关 寄存 器 出 栈 恢复 


A 过程 返 回 ， 
图 8-19 ”过 程 put_char 的 流程 图 


庞大 复杂 的 建筑 必须 得 有 图 纸 才 能 施工 ， 而 绘制 图 纸 的 过 程 中 你 经 
种 及 现 目 己 有 更 好 的 设计 思路 ， 更 能 知道 如 何 瘟 这 栎 房子。 编写 复杂 的 
程序 前 先 男 一 画 流 程 图 ， 征 程序 员 的 基本 系 养 ， 这 有 助 于 问题 的 解 次 。 






代码 清单 8-2 第 43 一 48 行 ， 在 过 程 put_char 的 开始 部 分 先 将 用 到 的 
部 分 寄存 器 压 栈 保存 ， 其 中 包括 两 个 段 寄 存 器 DS 和 ES 。 

第 51 一 53 行 ， 通 过 系 引 刀口 告诉 显卡 ， 现 在 要 操作 0x0e 写 寄 存 
器 。 

第 54 一 56 行 ， 通 过 数据 端口 从 0x0e 号 端口 读 出 1 字 节 的 数据 ， 并 传 
送 到 寄存 器 AH 中 ， 这 是 屏幕 光标 位 置 的 高 8 位 。 

同样 地 ， 第 58 一 62 行 ， 从 0x0f 号 寄存 器 谈 出 光标 位 置 的 低 8 位 。 现 
在 ， 寄 存 器 AX 中 是 完整 的 光标 位 置 数 据 。 第 63 行 ， 将 这 个 数值 传送 到 
寄存 器 BX 中 保存 ， 因 为 马上 了 吏 要 用 到 寄存 器 AX。 


8.4.6 ”处 理 回 车 和 换行 字符 


过 程 put_char 仅 接 受 一 个 寄存 需 参 数 CL， 用 于 提供 要 显示 的 ASCI| 
僻 。 篆 规 字 符 和 回 车 、 换 行 符 将 不 同 对 待 ， 为 此 ， 需 要 首先 别 出 它 们 。 

代码 清单 8-2 第 65、66 行 ， 先 判断 是 不 是 回 车 符 0x0d。 如 果 是 的 
话 ， 继 续 往 下 执行 ， 如 果 不 是 ， 则 转移 到 标号 .put_0a 处 执行 。 


先 来 看 看 如 果 是 0x0d 的 情况 。 

如 果 是 回 车 符 0x0d， 那 么 ， 应 将 光标 移动 到 当前 行 的 行 首 。 每 行 有 
80 个 字符 ， 那 么 ， 用 当前 光标 位 置 除 以 80， 人 余数 不 要 ， 恕 可 以 得 到 当前 
行 的 行 号 。 接 着 ， 再 乘 以 80， 就 是 当前 行 行 首 的 光标 数值 。 

很 好 ， 人 代码 清单 8-2 第 67 一 69 行 ， 用 寄存 器 AX 中 的 光标 位 置 除 以 寄 
存 器 BL 中 的 80， 在 AL 中 得 到 的 是 当前 行 的 行 号 。 


接着 ， 第 70、71 行 ， 将 寄存 器 AL 中 的 内 容 乘 以 寄存 器 BL 中 的 80， 
会 在 寄存 器 AX 中 得 到 当前 行 行 首 的 光标 值 。 该 值 依然 传送 到 寄存 器 BX 
中 保存 。 


和 div 指令 相反 ，mul 征 乘 法 指令 ， 格 式 如 下 : 


miul Ee ;AX=ALxr/m8 

mul r/ml6 >: DX: AX=AX*E/NMLS6 
以 上 ，“ 表 示 通 用 寄存 器 ，“m" 表 示 内 存单 元 。 就 是 说 ，mul 指令 可 
以 用 8 位 的 通用 宥 存 句 或 者 内 存 蛙 元 中 的 数 和 寄存 右 AL 中 的 内 容 相 乘 ， 


结 来 是 16 位 ， 在 AX 寄存 右 中 ; 也 可 以 用 16 位 的 通用 寄存 如 或 者 内 存 早 
元 中 的 数 和 寄存 硕 AX 中 的 内 容 相 乘 ， 结 未 是 32 位 ， 届 16 位 和 低 16 位 分 
列 在 DX 和 AX 中 。 


举 几 个 例子 : 
nL BX 
maul dx 
mul byte [bxl] ;8 位 内 存单 元 
mul byte [bx+dil] ;8 位 内 存单 元 
mul word [0x2000] ;16 位 内 存单 元 


mul 指令 执行 后 ， 要 是 结果 的 局 一 半 为 全 0， 则 OF 和 CF 清 零 ， 含 则 
置 1。 对 SF、ZF、AF 和 PF 标志 的 影响 未 定义 。 


第 72 行 ， 转 移 到 标号 .set cursor 处 设置 光标 在 屏幕 上 的 位 置 。 


如 条 要 显示 的 字符 不 是 0x0d， 那 么 ， 它 有 可 能 是 0x0a， 或 者 是 正 各 
的 可 打印 字符 。 这 里 的 "打印 ”， 可 以 理解 为 在 屏 医 上 打印 。 


为 此 ， 第 75 一 77 行 ， 先 判断 是 不 是 0x0a， 如 果 不 是 ， 那 就 转移 到 标 
写 .put_other 处 ， 去 正章 显示 可 打印 字符 。 如 末 是 ， 那 么 ， 换 行 的 意图 是 
器 下 挪 一 行 ， 只 需要 将 寄存 器 BX 的 内 容 增 加 80， 即 可 得 到 新 的 光标 位 置 
数据 。 但 是 ， 不 像 回 车 ， 如 采光 标 原 先 驶 在 屏幕 最 后 一 行 ， 那 么 ， 换 行 
之 后 ， 会 怎样 呢 ? 所 以 ， 第 78 行 ， 立 即 转移 到 标 扎 .roll_screen 处 执行 。 
在 那里 ， 将 根据 情况 决定 是 否 需要 滚屏 。 


8.4.7 显示 可 打印 字符 


下 面 开始 正常 亦 示 可 打印 字符 。 

第 81、82 行 ， 将 附加 段 寄 存 器 ES 设置 为 指向 显存 。 注 意 ， 在 过 程 
开始 处 ， 己 经 将 ES 的 内 容 压 栈 傈 存 了 ， 这 里 可 以 随意 使 用 该 寄存 价 。 

标准 模式 下 ， 屏 幕 上 可 以 同时 显示 2000 个 字符 。 光 标 占 用 一 个 字符 
的 位 置 ， 但 整个 屏 顺 只 有 一 个 ， 只 能 出 现在 2000 个 字符 位 置 中 的 一 个 
上 。 典 型 地 ， 程 序 员 要 用 光标 位 置 来 记载 和 跟踪 下 一 个 字符 应 当 显 示 在 
什么 位 置 。 光 标 用 来 指示 字符 位 置 ， 而 一 个 字符 在 显存 中 对 应 两 个 字 
让 。 如 此 一 来 ， 可 以 将 光标 位 置 习 以 2， 来 得 到 该 位 置 (字符 ) 在 显存 中 
的 俩 移 地 址 。 


第 83 行 ， 将 寄存 大 BX 的 内 容 锡 辑 元 移 1 次 ， 这 相当 于 将 其 滋 以 2。 
毕竟 只 是 乘 以 2， 而 且 BX 中 的 数值 不 大 ， 这 样 做 ， 比 使 用 乘法 指令 mul 
来 得 方便 。 

第 84 行 ， 用 BX 的 内 容 作 为 信 移 地 址 ， 来 访问 段 寄 存 器 ES 所 指 回 的 
显 仔 ， 来 写 入 机 显示 的 字符 。 你 可 能 免得 奇怪 ， 为 什么 后 面 没 有 与 显示 
属性 字 节 。 原 因 很 简单 ， 在 写 入 其 他 内 容 之 前 ， 有 显存 里 全 是 墨 撒 日 字 的 
宇 日 字符 ， 所 以 不 需要 重 与 墨 展 日 字 的 属性 。 过 程 put_char 十 以 黑 捅 日 
字 来 显示 字符 的 。 

第 87、88 行 ， 将 寄存 莫 BX 的 内 容 除 以 2， 恢 复 它 的 光标 位 置身 份 。 
接着 ， 将 其 增加 1《〈 在 数值 上 ， 将 光标 推进 到 下 一 个 位 置 ， 毕 竟 还 设 开 始 
设置 光标 呢 ) 。 指 令 shr 是 已 经 讲 过 的 馆 辑 右 移 指 令 ， 相 当 于 除 以 2。 

个 过 是 换行 ， 还 是 正 利 显示 字符 后 推进 光标 ， 都 会 使 寄存 卉 BX 的 内 
容 超 过 1999。 下 面 ， 束 来 判断 这 个 情况 ， 并 决定 是 否 深 动 屏 幕 内 容 。 


8.4.8 滚动 屏幕 内 容 


第 91、92 行 ， 比 较 寄存 右 BX 中 的 内 容 是 否 小 于 2000。 如 有 果 是 的 
话 ， 很 好 ， 很 正常 ， 和 直接 转移 到 标 写 .set_cursor 处 设置 光标 ;否则 继续 
往 下 执行 以 滚动 屏幕 内 容 。 

滚动 屏 腊 内容， 实质 上 了 吏 是 将 屏 太 上 第 2 一 25 行 的 内 容 整 体 住 上 提 
一 行 ， 最 后 用 漂 搬 日 字 的 空 日 凶 从 填 元 第 25 行 ， 使 这 一 行 什么 也 不 显 
不 。 

为 了 加 快速 度 ， 提 高 效率 ， 程 序 里 采用 的 是 将 数据 从 一 个 内 存 区 域 
( 块 ) 搬运 到 另 一 个 内 存 区 域 〈 抉 ) 的 做 法 ， 核 心 指 令 是 movsw。 


第 94 一 101 行 ， 设 定 源 区 域 从 显存 内 偏 移 地 址 为 0xa0 〈 屏 幕 第 2 行 
第 1 列 的 位 置 ) 的 地 方 开始 ， 该 区域 的 段 地 址 在 段 寄存 器 DS 中 ， 偏 移 地 
址 在 变 址 寄存 器 SI 中 ; 目标 区 域 从 显存 内 偏 移 地 址 为 0x00 (屏幕 第 1 行 
第 1 列 的 位 置 ) 的 地 方 开 始 ， 该 区 域 的 段 地 址 在 段 和 寄存器 ES 中 ， 偏 移 地 
址 在 变 址 寄存 器 DI 中。 同时， 设置 方 同 标志 ， 并 在 寄存 器 CX 中 设置 要 
传送 的 字数 1920 (24 行 乘 以 80 个 字符 / 行 ， 再 乘 以 每 个 字符 占用 的 字 市 
数 2， 再 除 以 2 字 节 / 字 ) 。 最 后 ， 执 行 rep movsw 以 完成 传送 工作 。 


屏 攻 最 下 面 一 行 〈 第 25 行 ) 还 有 原来 的 内 容 ， 必 须 了 予以 清除 。 第 25 
行 第 1 列 在 显存 中 的 偏 移 地 址 是 3840。 为 此 ， 第 102 一 107 行 ， 使 用 黑 底 
日 字 的 空白 字符 循环 写 入 这 一 行 。 

最 后 ， 第 109 行 ， 深 屏 之 后 ， 光 标 应 当 位 于 最 后 一 行 的 第 1 列 ， 其 数 
值 为 1920， 这 一 行 的 指令 将 这 个 狐 的 数值 传送 到 寄存 器 BX 中 。 


8.4.9 重 置 光标 


不 党 是 回 和 车 、 换 行 ， 还 是 显示 可 打印 的 字符 ， 上 面 的 各 处 都 给 出 了 
光标 位 症 的 新 数值 。 下 面 的 工作 融 是 投 给 出 的 数值 在 屏 磊 上 设置 光标 。 


第 112 一 123 行 ， 还 是 依照 老 规矩 ， 通 过 索引 端口 指定 光标 寄存 器 
0x0e 和 0xof， 并 分 别 将 寄存 器 BX 中 的 高 8 位 和 低 8 位 通过 数据 段 口 
0x3d5 写 入 它们 。 


最 后 ， 第 125 一 130 行 ， 从 栈 中 依次 弹出 并 恢复 各 个 寄存 器 的 原始 内 

第 132 行 ， 指 令 ret 从 栈 中 恢复 指令 指针 寄存 需 IP 的 内 容 ， 返 回 到 调 
用 者 put_ string 过 程 。 当 字符 串 msg0 中 所 有 的 字符 都 显示 完毕 后 ， 过 程 
put_string 返回 到 用 户主 程序 ， 从 第 147 行 接着 往 下 执行 。 


8.4.10 切换 到 另 一 个 代码 段 中 执行 


在 一 个 程序 中 ， 对 段 的 数量 没有 限制 。 可 以 有 多 个 代码 段 和 多 个 数 
据 段 ， 甚 至 可 以 有 多 个 栈 段 。 在 用 户 程 序 工作 时 ， 可 以 从 一 个 代码 段 转 
到 另 一 个 代码 段 中 执行 ， 也 可 以 根据 需要 ， 访 问 不 同 的 数据 段 。 

我 们 知道 ，ret 和 retf 指令 分 别 用 于 近 返 回 和 远 返 回 。 人 类 最 大 的 加 
题 就 是 思维 有 定 势 ， 有 时 候 不 够 开阔 。 尺 管 说 是 “返回 "， 但 最 重要 的 还 是 
弄 清 它 的 原理 和 本 质 ， 才 能 灵活 运用 。 

返回 指令 的 动作 是 从 栈 中 弹出 内 容 到 指令 指针 寄存 硕 IP， 如 果 是 远 
返回 的 话 ， 还 要 接着 弹出 内 容 到 代码 段 寄存 器 CS。 假 如 在 此 之 前 ， 栈 顶 
的 内 容 并 非 是 用 于 返回 的 偏 移 地 址 和 有 段 地 址 ， 那 么 处 理 器 当时 就 会 傻 
je 


还 是 回 到 正题 上 来 。 假 如 要 想 切 换 到 另 一 个 代码 段 中 执行 ， 可 以 使 
用 远 调用 指令 (call far) 或 者 远 转移 指令 (jmp far) ， 这 是 最 正常 不 过 
的 途径 了 。 

问题 在 于 ， 为 了 实现 段 间 控 制 转 移 ， 必 须 事先 开辟 两 个 连续 的 内 存 
单元 ， 存 放 男 一 个 代码 段 的 入 口 点 偏 移 地 址 和 上段 地 址 ， 代 价 似 乎 有 点 
局 ， 这 么 做 好 保 不 太 值得 。 


为 了 省 事 ， 可 以 使 用 指令 retf 来 模拟 段 男 返回 ， 以 实现 段 间 转移 。 代 
伺 清单 8-2 第 147 行 ， 先 在 栈 中 压 入 代码 段 code_2 的 段 地 址 ; 接着 ， 第 
148、149 行 ， 压 入 偏 移 地 址 ， 该 偏 移 地 址 就 是 标 写 begin 在 编译 阶段 的 
汇编 地 址 。8086 处 理 喜 不 能 在 栈 中 压 入 立即 数 ， 所 以 只 能 通过 寄存 右 AX 
来 间接 做 这 件 事 ， 现 在 的 处 理 器 都 支持 压 入 立即 数 : 


BUush worg OXx55TIt 
当然 ， 这 是 后 话 。 
第 151 行 ， 当 处 理 器 执行 指令 retf 时 ， 这 个 被 蒙 在 鼓 里 的 家 伙 从 栈 中 
将 偏 移 地 址 和 上段 地 址 分 别 弹出 到 代码 段 寄 存 幽 CS 和 指令 指针 寄存 如 IP， 
于 是 控制 立即 转移 到 段 code 2 中 ， 从 标号 begin 处 开始 执行 。 


这 段 代 码 很 好 地 证 明了 ， 尽 管 call 和 call far 指令 分 别 依 赖 于 ret 和 
retf 指令 ， 但 后 者 却 并 不 依赖 于 前 者 。 它 们 经 常 在 一 起 ， 但 并 不 是 夫妻 。 


8.4.11 访问 另 一 个 数据 段 


你 可 以 在 代码 段 code _2 中 做 任何 事 。 但 是 ， 我 们 这 里 什么 也 没 干 ， 
仅仅 是 用 相同 的 方法 ， 再 次 返回 到 段 code 1 中 。 有 具体 的 做 法 ， 可 以 参考 
代码 清单 8-2 第 166 一 170 行 。 


回 到 第 154、155 行 ， 由 于 上 自从 进入 用 户 程 序 之 后 ， 段 寄存 侣 ES 一 
直 是 指 回 头 部 段 header 的 ， 所 以 ， 这 两 条 指令 用 于 将 第 二 个 数据 段 
data 2 的 段 地 址 传送 到 段 寄 存 器 DS， 这 等 于 是 换 了 一 个 数据 段 。 

第 二 个 数据 段 data_2 是 在 第 194 行 定 义 的 ， 而 且 包 含 了 “vstart=0” 子 
句 。 在 该 段 内 ， 仅 仅 声明 了 标号 msg1 并 初始 化 了 一 个 字符 串 。 当 然 ， 它 
也 是 0 结尾 的 。 


接 痢 回 到 前 面 的 第 157 行 ， 将 刚才 那个 字符 串 的 起 始 侦 移 地 址 传送 
到 寄存 器 BX。 第 158 行 ， 调 用 过 程 put_string 从 屏幕 的 光标 处 开始 显示 
该 字符 串 。 


8.5 ”编译 和 运行 程序 并 观察 结果 


退 第 ， 用 尸 程 序 执 行 完 第 后 ， 应 当 章 新 将 控制 返回 到 加 载 囊 ， 加 载 
人 船 可 以 重新 加 载 和 运行 其 他 程序 ， 所 有 的 操作 系统 都 是 这 么 做 的 。 

壮 憾 的 是 ， 我 们 的 加 载 融 不 提供 这 样 的 功能 ， 而 用 尸 程 序 也 没有 将 
控制 返回 到 加 载 蔡 ， 而 是 百 接 进 入 无 限 循环 : 


jmp $ 


当然 ， 这 不 是 什么 了 不 得 的 事情 ， 将 控制 返回 到 加 载 磊 ， 其 实现 也 
不 复杂 。 如 果 你 有 兴趣 ， 可 以 试 一 试 。 但 是 ， 唯 一 厂 烦 的 地 方 是 栈 ， 将 
控制 返回 的 同时 ， 也 必须 切换 到 加 载 右 目 己 的 栈 ， 一 定 要 小 心 ! 

对 本 章 源 代码 的 讲解 到 此 结束 。 你 可 以 在 配 书 工 具 中 找到 源 代码 
c08_mbr.asm 和 c08.asm， 或 者 自己 手工 编辑 这 两 个 文件 。 

首先 编 详 源 程 序 c08 mbrasm， 将 编 详 后 得 到 的 c08_mbrbin 文件 与 
入 虚拟 硬盘 主 引导 扇 区 〈 逻 辑 0 忆 区) 。 然 后 ， 编 译 源 程序 c08.asm， 并 
将 生成 的 c08.bin 文件 写 入 虚拟 硬盘 的 馆 辑 100 局 区 。 


全 | ny a > y > 上 HU 、 人 — 2 -> 
注意 ， 在 编译 c08.asm 时 ， 编 译 器 将 会 产生 警告 信息 : 
c08 .asm:203: warning: uninitialized space declared in stack section: zeroing 


这 颁 话 的 意思 是 ，c08.asm 产程 序 的 第 203 行 声明 了 未 初始 化 的 空 
间 。 

还 记得 吗 ? 在 那里 ， 我 们 用 resb 伪 指 令 保留 了 256 字 节 的 栈 空间 ， 
这 段 空 间 是 未 初始 化 的 。 


源 程 序 的 编译 过 程 也 下 排 错过 程 ， 你 该 感到 高 兴 ， 而 不 是 害 介 ， 只 
有 合乎 规范 的 程序 才能 最 终 获 得 通过 。 编 译 占 通常 会 有 两 种 提示 ， 一 种 
征 错误 ， 万 一 种 是 警 生 。 

音 误 《Error) 衣 明 程序 中 有 编译 大 个 认识 的 指令 、 不 正 硝 的 语法 和 
无 法 解释 的 内 容 ， 在 这 种 情况 下 ， 编 诺 苍 简单 地 香 诉 你 是 哪 一 行 有 钳 
误 ， 以 及 什么 性 质 的 错误 ， 并 停止 编 详 。 


警告 (Warning) 通常 表示 程序 中 有 一 些 不 规范 的 指令 用 法 。 在 这 种 
情况 下 ， 编 译 器 继续 完成 编译 工作 ， 生 成 编译 结果 。 通 常情 况 下 ， 编 译 


现在 ， 局 动 虚 拟 机 ， 正 第 情况 下 ， 运 行 结束 应 当 如 图 8-20 所 示 。 





Back at SourcerF 
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后 的 结果 也 能 正 弟 运行 。 
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图 8-20 ”本 章程 序 运 行 结 





本 章 习 题 


1. 修改 本 和 章 源 程序 8-2， 在 不 使 用 retf 指令 的 情况 下 ， 从 段 code 1 
转移 到 段 code 2 执行 。 

2. 思考 一 下 ， 如 果 去 掉 代 码 清 单 8-1 的 第 38、39 行 ， 会 发 生 什么 情 
1 所 2 


第 9 章 ” ”中断 和 动态 时 钟 显 示 


在 享受 计算 机 给 我 们 市 来 的 便利 和 乐趣 的 同时 ， 我 仍然 会 时 不 时 地 
襄 它 的 坏话 。 人 人们 都 说 处 理 规 是 整个 计算 机 的 大 脑 ， 可 征 ， 处 理 融 是 一 
个 非 党 精确， 速度 又 快 的 傻子 。 


在 计算 机 上 执行 的 程序 通 币 需 要 一 些 输入 ， 输 入 可 能 来 目 于 键盘 、 
中 标 、 便 熏 、 话 徐 、 数 码 相 机 等 ， 同 时 ， 处 理 后 还 需要 和 输出， 要 送 到 答 
出 说 备 ， 如 显示 蓝 、 人 硬盘、 打印 机 、 网 络 设 备 等 。 


一 个 程序 只 做 自己 的 事 ， 当 它 等 待 输入 ， 或 者 等 待 输出 时 ， 它 面 对 
的 是 比 处 理 器 慢 得 多 的 外 部 设备 。 典 型 的 情况 下 ， 硬 盘 的 工作 速度 比 处 
理 器 至 少 慢 几 千 万 甚至 几 亿 倍 ， 像 打印 机 这 类 设备 就 更 不 用 说 了 。 在 等 
待 的 时 候 ， 处 理 器 唯一 所 能 做 的 ， 就 是 不 停 地 观察 外 部 设备 的 状态 变 
化 。 


计算 机 车 命 的 时 期 ， 人 硬件 资源 极其 昂贵 和 牧人 少 。 据 说 20 世纪 60 年 
代 ， 一 台 计 算 机 的 价格 抵 得 上 300 辆 野马 跑车 ， 月 租金 超过 一 万 美金 。 
这 么 男 贯 的 东西 ， 个 好 好 利用 它 束 古 一 种 啡 过 ，。 


为 了 分 时 计 算 能 力 ， 处 理 融 应 当 能 够 为 多 用 户 多 任务 提供 使 件 一 级 
的 支持 。 在 单 处 理 右 有 的 系统 中 ， 人 允许 同时 有 多 个 程序 在 内 存 中 等 行 处 理 
名 的 执行 。 当 一 个 程序 正在 等 行 输 入 输出 时 ， 人 允许 为 一 个 程序 从 处 理 右 
那里 得 到 执行 权 。 


如 何 把 多 个 程序 调 入 内 存 ， 有 是 操作 系统 的 事情 ， 这 个 可 以 先 放 一 
放 。 现 在 的 问题 是 ， 当 一 个 程序 执行 时 ， 它 是 不 会 知道 还 有 别 的 程序 正 
上 腿 巴 巴 地 等 着 执行 。 在 这 种 情况 下 ， 中 汤 (Interrupt〉 这 种 工作 机 制 就 应 
运 而 生 了 。 

中 断 就 是 打 断 处 理 絮 当前 的 执行 流程 ， 去 执行 男 外 一 些 和 当前 工作 
不 相干 的 指令 ， 执 行 完 之 后 ， 还 可 以 返回 到 原来 的 程序 流程 继续 执行 。 
这 就 好 比 是 你 正在 用 手机 听 歌 ， 突 然 来 电话 了。 处 理 右 (当然 ， 手 机 也 
是 有 处 理 郝 的 ) 必须 中 新 歌曲 的 播放 ， 来 处 理 这 件 更 为 重要 的 事件 。 


目 从 中 断 这 种 工作 机 制 产 生 之 后 ， 它 束 一 卫 丰 各 种 处 理 如 必须 具备 
的 机 制 。 中 断 是 怎么 用 生 的 ， 处 理 大 又 是 怎么 处 理 中 断 的 ， 在 这 个 过 程 


中 ， 我 们 又 能 做 些 什 么 ， 这 都 是 本 章 将 要 告诉 你 的 。 总 起 来 说 ， 本 章 的 
任务 是 : 

1. 了解 中 断 的 原理 和 分 类 ， 用 两 个 具体 的 实例 来 学 习 如 何在 中 断 机 
制 下 工作 ， 包 括 如 何 使 用 BIOS 中 断 工 作 。 

2. 学 会 在 Bochs 中 观察 中 断 问 量 表 和 中 断 标 将 位 IF 的 变化 。 


3. 学 习 一 些 新 的 X86 处 理 器 指令， 包括 into、int3、int n、iret、 
cli、sti、hlt、not 和 test 等 。 


9.1 外 部 人 硬件 中 断 


顾名思义 ， 外 部 价 件 中 断 ， 束 是 从 处 理 右 外面 来 的 中 断 信 扎 。 当 外 
部 设备 肥 生 错误 ， 或 者 有 数据 要 传 迹 〈 比 如， 从 网 络 中 接收 到 一 个 针对 
当前 主机 的 数据 包 ) ， 或 者 处 理 帮 交 给 它 的 事情 处 理 完了 比如， 打印 
已 经 完成 )， 它 们 部会 招 一 下 处 理 右 的 屑 膀 ， 告 诉 它 应 当先 把 手 涉 上 的 
事情 放 一 放 ， 来 临时 处 理 一 下 。 

如 图 9-1 所 示 ， 外 部 便 件 中 断 是 通过 两 个 信号 线 引 入 处 理 右 内 部 有 的 。 
从 很 早 的 时 候 起 ， 也 就 是 8086 处 理 各 的 时 代 ， 这 两 根 线 的 名 字 惑 叫 NMI 
和 INTR。 


RAM# (内 存 校 验 错 ) 
IOCHK# (1/O 校 验 错 ) 





图 9-1 Intel 处 理 器 上 的 不 可 屏 贡 中 晰 示意 图 


9.1.1 非 屏 珊 中 断 


在 某 些 具有 怀疑 精神 的 人 眼 里 ， 用 两 根 信 号 线 来 接受 外 部 设备 中 断 
可 能 是 多 余 的 ， 也 许 只 需要 一 根 束 可 以 了 。 这 似乎 有 此 道理 ， 但 是 ， 来 
目 外 部 设备 的 中 断 很 多 ， 也 不 是 每 一 个 中 断 都 是 必须 处 理 的 。 有 些 中 
断 ， 在 任何 时 候 都 必须 及 时 人 处理 ， 因 为 事 关 整个 系统 的 安全 性 。 比 如 ， 
在 使 用 不 间断 电源 的 系统 中 ， 当 电池 电量 很 低 的 时 候 ， 不 间断 电源 系统 
会 发 出 一 个 中 断 ， 通 知 处 理 器 快 掉 电 了 。 再 比如 ， 内 存 访问 电路 发 现 了 
一 个 校 验 错误 ， 这 意味 着 ， 从 内 存 读 取 的 数据 是 错误 的 ， 处 理 器 再 努力 
工作 也 是 没有 意义 的 。 在 所 有 这 些 情 况 下 ， 处 理 絮 必须 针对 这 些 中 断 采 
取 必 要 的 措施 ， 隐 眶 真相 必然 会 对 用 户 造 成 不 可 挽回 的 损失 。 除 此 之 
外 ， 更 多 的 中 断 是 可 以 被 忽略 或 者 延迟 处 理 的 ， 如 果 某 个 程序 希望 不 被 
打扰 的 话 。 


在 这 种 情况 下 ， 处 理 器 的 设计 者 硕 望 通过 两 个 引 脚 来 明确 区 分 不 同 
性 质 的 中 断 ， 这 有 是 很 目 然 的 事 。 首 先 ， 所 有 的 严重 事件 都 必须 无 条 件 地 
加 以 处 理 ， 这 种 类型 的 中 断 是 不 会 家 阻 朵 和 屏 表 的， 称 为 非 屏 届 中 断 
(Non Maskable Interrupt, NMI) 。 


中 断 信号 的 来 源 ， 或 者 议 ， 产 生 中 断 的 设备 ， 称 为 中 断 源 。 如 图 9-1 
所 示 ， 在 传统 的 兼容 模式 下 ，NMI 的 中 断 源 通过 一 个 与 非 门 连接 到 处 理 
句 。 处 理 普 的 NMI 引 脚 是 高 电 平 有 效 的， 而 中 断 信号 是 低 电 平 有 效 的 。 
当 不 存在 中 断 的 时 候 ， 与 非 门 的 万 有 输入 都 为 高 ， 因 此 处 理 规 的 NMI 引 
脚 为 低 电 平 ， 这 意味 痢 没 有 中 上 断 必 生 。 


当 有 任何 一 个 非 屏 蔽 的 中 断 产 生 时 ， 与 非 门 的 输出 为 高 。lntel 处 理 
器 规定 ，NMI 中 断 信号 由 0 跳 变 到 1 后 ， 至 少 要 维持 4 个 以 上 的 时 钟 周期 
才 算 是 有 效 的 ， 才 能 被 识别 。 

注意 ， 不 要 把 这 幅 图 当成 是 不 变 的 真理 ， 这 是 一 个 人 简化 的 示意 图 ， 
不 是 真正 的 设备 连接 图 。 

当 一 个 中 断 发 生 时 ， 处 理事 将 会 通过 中 断 引 脚 NMI 和 INTR 得 到 通 
知 。 除 此 之 外 ， 它 还 应 当知 道 发 生 了 什么 事 ， 以 便 采取 适当 的 处 理 措 
施 。 每 种 类 型 的 中 断 都 被 统一 编号 ， 这 称 为 中 断 类 型 号 、 中 断 问 量 或 者 
中 断 号 。 但 是 ， 由 于 不 可 屏蔽 中 断 的 特殊 性 一 一 几乎 所 有 触发 NMI 的 事 
件 对 处 理 器 来 说 都 是 致命 的 ， 甚 至 是 不 可 纠正 的 。 在 这 种 情况 下 ， 努 力 
去 摘 清 楚 发 生 了 什么 ， 通 彰 没 有 太 大 的 意义 ， 这 样 的 事 最 好 留 到 事后 ， 
让 专业 维修 人 员 来 做 。 

也 正 是 这 个 原因 ， 在 实 模式 下 ，NMI 被 赋予 了 统一 的 中 断 号 2， 不 再 
进行 细 分 。 一 旦 发 生 2 号 中 断 ， 处 理 器 和 软件 系统 通常 会 放弃 继续 正常 工 
作 的 “念头 ”， 也 不 会 试图 纠正 已 经 发 生 的 问题 和 错误 ， 很 可 能 只 是 由 软件 
系统 给 出 一 个 提示 信息 。 


9.1.2 ”可 屏蔽 中 晰 


和 NMI 不 同 ， 更 多 的 时 候 ， 有 发 往 处 理 堪 的 中 断 信号 通关 不 会 意味 看 
灾难 。 当 然 ， 有 了 时候 也 会 非常 案 急 ， 比 如 ， 在 一 个 由 计算 机 控制 的 车 床 
上 ， 当 零件 快速 通过 铣 具 时 ， 处 理 带 应 当 立 即 处 理 中 断 ， 并 同 铣 具 妈 这 
信号 ， 生 诉 它 应 当 如 何 切削 。 


这 关中 断 有 两 个 特点 ， 第 一 是 数量 很 多 ， 毕 竟 有 很 多 外 部 设备 : 第 
二 是 它们 可 以 极 屏 散 ， 这 样 处 理 右 束 像 是 没 听 见 、 没 看 见 一样 ， 不 会 对 
它们 进行 处 理 。 所 以 ， 这 疾 便 件 中 断 称 为 可 屏 届 中 断 。 尽 管 不 处 理 中 断 
驶 会 把 堆 件 铣 坏 ， 但 是 个人 允许 处 理 套 看 见 该 中 断 ， 古 你 目 己 的 事 ， 这 征 
处 理 融 赋予 你 的 权利 。 


可 屏蔽 中 断 是 通过 INTR 引 脚 进入 处 理 器 内 部 的 ， 像 NMI 一 样 ， 不 可 
能 为 每 一 个 中 断 源 都 提供 一 个 引 脚 。 而 且 ， 处 理 器 每 次 只 能 处 理 一 个 中 
断 。 在 这 种 情况 下 ， 需 要 一 个 代理 ， 来 接受 外 部 设备 发 出 的 中 断 信 号。 
还 有 ， 多 个 设备 同时 发 出 中 断 请 求 的 几率 也 是 很 高 的 ， 所 以 该 代理 的 任 
务 还 包括 对 它们 进行 仲裁 ， 以 决定 让 它们 中 的 哪 一 个 优先 向 处 理 器 提出 
服务 请 求 。 

如 图 9-2 所 示 ， 在 个 人 计算 机 中 ， 用 得 最 多 的 中 断代 理 束 是 8259 心 
片 ， 它 就 是 通常 所 说 的 中 断 控制 器 ， 从 8086 处 理 器 开始 ， 它 就 一 直 提 供 
者 这 种 服务 。 即 使 是 现在 ， 在 绝 大 多 数 单 处 理 器 的 计算 机 中 ， 也 依然 有 
它 的 存在 。 


Intel 处 理 右 允许 256 个 中 断 ， 中 断 号 的 范围 是 0 一 255，8259 负责 所 
供 其 中 的 15 个 ， 但 中 断 号 并 不 固定 。 之 所 以 不 固定 ， 是 因为 当初 设计 的 
时 候 ， 人 允许 软件 根据 自己 的 需要 灵活 设置 中 汤 号 ， 以 防止 发 生 冲 突 。 访 
中 晰 控制 占 已 片 有 上 自己 的 端口 号 ， 可 以 像 访 问 其 他 外 部 设备 一 样 用 in 和 
out 指令 来 改变 它 的 状态 ， 包 括 各 引 脚 的 中 断 写 。 正 是 因为 这 样 ， 它 又 叫 
可 编程 中 断 控制 器 〈Programmable Interrupt Controller，PIC) 。 


系统 定时 器 /计数 器 





图 9-2 ” 单 处 理 器 系统 的 中 断 机 人 制 


个 知道 是 怎么 想 的 ， 反正 每 片 8259 只 有 8 个 中 断 输入 引 脚 ， 而 在 个 
人 计算 机 上 使 用 它 ， 需 要 两 块 。 如 图 9-2 所 示 ， 第 一 块 8259 芯片 的 代理 
输出 INT 直接 送 到 处 理 器 的 INTR 引 脚 ， 这 是 主 上 (Master) ; 第 二 块 
8259 心 片 的 INT 输出 送 到 第 一 块 的 引 脚 2 上 ， 是 从 片 (Slave) ， 两 块 必 
片 之 间 形 成 级 联 (Cascade) 关系 。 


如 此 一 来 ， 两 块 8259 心 片 可 以 同 处 理 器 提供 15 个 中 断 信 和 号。 当 
时 ， 接 在 8259 上 的 15 个 设备 都 是 相当 重要 的 ， 如 PS/2 键盘 和 鼠标 、 串 
行 口 、 并 行 口 、 软 磁盘 驱动 器 、IDE 硬盘 等 。 现 在 ， 这 些 设 备 很 多 都 已 
淘汰 或 者 正在 淘汰 中 ， 根 据 需 要 ， 这 些 中 断 引 脚 可 以 被 其 他 设备 使 用 。 


如 图 9-2 所 示 ，8259 的 主 片 引 脚 0 (CIR0) 接 的 是 系统 定时 器 /计数 器 
心 片 ; 从 片 的 引 脚 0 (RO0) 接 的 大 实时 时 钟 芯 片 RTC， 该 芯片 是 本 章 的 
主角 ， 很 快 承 会 讲 到 。 总 之 ， 这 两 块 心 片 的 固定 连接 即使 是 在 便 件 更 新 
换代 非常 频繁 的 今天 ， 也 依然 没有 改变 。 


在 8259 心 厂 内 部 ， 有 中 靳 屏蔽 琳 存 器 (Interrupt Mask Register， 
IMR ) ， 这 是 个 8 位 寄存 器 ， 对 应 着 该 芯片 的 8 个 中 断 输入 引 脚 ， 对 应 的 


位 是 0 还 是 1， 雇 定 了 从 该 引 脚 来 的 中 断 信 吉 是 售 能 够 通过 8259 过 往 处 
理 需 〈0 表示 允许，1 表示 阻 灯 ， 这 可 能 出 乎 你 的 意料 ) 。 当 外 部 设备 通 
过 某 个 引 脚 送 来 一 个 中 上 断 请 求 信 号 时 ， 如 果 它 没有 极 IMR 阻 断 ， 那 么 ， 
它 可 以 被 送 往 处 理 器 。 注 意 ，8259 芯片 是 可 编程 的 ， 主 片 的 端口 号 是 
0x20 和 0x21， 从 片 的 端口 号 是 0xa0 和 0xa1， 可 以 通过 这 些 端口 访问 
8259 心 上 请， 设置 它 的 工作 方式 ， 包 括 IMR 的 内 容 。 


中 断 能 人 否 被 处 理 ， 除 了 要 看 8259 蕊 片 的 脸色 外 ， 最 终 的 决定 权 在 处 
理 旧 手 中 。 回 到 前 面 第 6 半 ， 参 阅 图 6-2， 你 会 发 现 ， 在 处 理 占 内 部 ， 标 
志 寄 存 句 有 一 个 标 总 位 IF， 这 就 是 中 断 标志 〈Interrupt Flag) 。 当 IF 为 0 
时 ， 所 有 从 处 理 噩 INTR 引 肢 来 的 中 断 信号 都 被 忽略 挥 ， 当 其 为 1 时 ， 处 
理 帮 可 以 接受 和 啊 应 中 也 。 

IF 标志 位 可 以 通过 两 条 指令 cli 和 sti 来 改变 。 这 两 条 指令 都 没有 操作 
数 ，cli (CLear Interrupt flag) 用 于 清除 IF 标志 位 ，sti (SeT Interrupt 
flag〉 用 于 置 位 IF 标志 。 


检测 点 9.1 


写 一 个 小 的 主 引 导 程 序 ， 在 程序 中 使 用 sti 和 cli 指令 ， 并 用 Bochs 观 
察 IF 位 的 变化 。 


在 计算 机 内 部 ， 中 断 发 生得 非常 频 索 ， 当 一 个 中 断 正 在 处 理 时 ， 其 
他 中 断 也 会 陆续 到 来 ， 甚 至 会 有 多 个 中 断 则 时 发 生 的 情况 ， 这 都 无 法 预 
料 。 不 用 担心 ，8259 芯片 会 记 住 它们 ， 并 按 一 定 的 策略 诀 定 先 为 谁 服 
务 。 总 体 上 来 说 ， 中 断 的 优先 级 和 引 脚 是 相关 的 ， 主 所 的 IRO 引 脚 优 先 级 
最 高 ，IR7 引 脚 最 低 ， 从 片 也 是 如 此 。 当 然 ， 还 要 考虑 到 从 片 是 级 联 在 主 
片 的 IR2 引 脚 上 。 


最 后 ， 当 一 个 中 断 事件 正在 处 理 时 ， 如 果 来 了 一 个 优先 级 更 高 的 中 
汤 事 件 时 ， 人 允许 暂 时 中 止 当 前 的 中 断 处 理 ， 先 为 优先 级 较 局 的 中 断 事 件 
服务 ， 这 称 为 中 断 花 套 。 


9.1.3 ” 实 模 式 下 的 中 断 癌 量 表 


所 谓 中 断 处理 ， 归 根 结 底 就 是 处 理 器 要 执行 一 段 与 该 中 断 有 关 的 程 
序 〈 指 令 ) 。 处 理 器 可 以 识别 256 个 中 断 ， 那 么 理论 上 就 需要 256 段 程 
序 。 这 些 程序 的 位 置 并 不 重要 ， 重 要 的 是 ， 在 实 模式 下 ， 处 理 器 要 求 将 
它们 的 入 口 点 集中 存放 到 内 存 中 从 物理 地 址 0x00000 开始 ， 到 0x003ff 结 


束 ， 共 1KB 的 空间 内 ， 这 束 是 所 谓 的 中 断 问 量 表 〈Interrupt Vector 
Table, IVT) 。 


如 图 9-3 所 示 ， 每 个 中 断 在 中 断 癌 量 表 中 占 2 个 字 ， 分 别 是 中 断 处 理 
程序 的 偶 移 地 址 和 段 地 址 。 中 断 0 的 入 口 点 位 于 物理 地 址 0x00000 处 ， 
也 就 是 逻辑 地 址 0x0000:0x0000; 中 断 1 的 入 口 点 位 于 物理 地 址 0x00004 
处 ， 即 馆 辑 地 址 0x0000:0x0004; 其 但 中 断 以 此 医 推 ， 总 之 是 按 顺 序 的 。 


当中 断 发 生 时 ， 如 果 从 外 部 硬件 到 处 理 器 之 间 的 道路 都 是 畅通 的 ， 
那么 ， 处 理 器 在 执行 完 当 前 的 指令 后 ， 会 立即 着 手 为 硬件 服务 。 它 首先 
会 啊 应 中 断 ， 告 诉 8259 心 片 准备 着 手 处 理 访 中断 。 接 着 ， 它 还 会 要 求 
8259 心 片 把 中 断 号 送 过 来 。 

在 8259 心 片 那里 ， 每 个 引 脚 都 后 了 予 了 一 个 中 断 号 。 而 且 ， 这 些 中 断 
号 是 可 以 改变 的 ， 可 以 对 8259 编程 来 灵活 设置 ， 但 不 能 单独 进行 ， 只 能 
以 总 片 为 单位 进行 。 比 如 ， 可 以 指定 主 片 的 中 断 号 从 0x08 开始 ， 那 么 它 
每 个 引 脚 IRO~IR7 所 对 应 的 中 断 号 分 别 是 0x08 一 0x0e。 

中 断 信 号 来 自 哪 个 引 脚 ，8259 芯片 是 最 清楚 的 ， 所 以 它 会 把 对 应 的 
中 断 号 告诉 处 理 器 ， 处 理 器 拿 着 这 个 中 断 号 ， 要 顺序 做 以 下 几 件 事 。 


人 保护 断 点 的 现场 。 首 先 要 将 标志 寄存 器 FLAGS 压 栈 ， 然 后 清除 它 
的 IF 位 和 TF 位 。TF 是 陷阱 标志 ， 这 个 以 后 再 讲 。 接 着 ， 再 将 当前 的 代 
但 段 寄 存 右 CS 和 指令 指针 寄存 右 IP 压 栈 。 

@ 执行 中 断 处 理 程 序 。 由 于 处 理 器 已 经 拿 到 了 中 断 号 ， 它 将 该 号 码 
乘 以 4【〈 毕 葛 每 个 中 断 在 中 断 问 量 表 中 占 4 字 市 ) ， 就 得 到 了 该 中 断 入 口 
点 在 中 断 问 量 表 中 的 偏 移 地 址 。 接 着 ， 从 表 中 依次 取出 中 断 程序 的 仿 移 
地 址 和 段 地 址 ， 并 分 别传 送 到 IP 和 CS， 自 然 地 ， 处 理 器 就 开始 执行 中 断 
处 理 程 序 了 。 


FFEEF 


00400 
003FF 


| 中 断 2 的 入 口 地 址 


| 中 断 1 的 入 口 地 址 
00000 


| 中 断 0 的 入 口 地 址 
图 9-3” 实 模式 下 的 中 汤 问 量 表 


注意 ， 由 于 IF 标志 被 清除 ， 在 中 晰 处 理 过 程 中 ， 处 理 器 将 不 再 响应 
硬件 中 断 。 如 果 和 希望 更 高 优先 级 的 中 断 众 套 ， 可 以 在 编写 中 断 处 理 程 序 
时 ， 适 时 用 sti 指令 开放 中 断 。 

@) 返回 到 断 点 接着 执行 。 所 有 中 断 处 理 程序 的 最 后 一 条 指令 必须 是 
中 断 返 回 指令 iret。 这 将 导致 处 理事 依次 从 栈 中 弹出 〈 恢 复 ) IP、CS 和 
FLAGS 的 原始 内 容 ， 于 是 转 到 主 程序 接着 执行 。 


iret 同样 没有 操作 数 ， 执 行 这 条 指令 时 ， 人 处理 禹 依次 从 栈 中 弹出 数值 
到 IP、CS 和 标志 寄存 器 


顺便 提醒 一 句 ， 由 于 中 断 处 理 过 程 返回 时 ， 已 经 恢复 了 FLAGS 的 原 
始 内 容 ， 所 以 IF 标志 位 也 上 自动 恢复 。 也 就 是 说 ， 可 以 接受 新 的 中 断 。 


和 可 屏蔽 中 断 不 同 ，NMI 及 生 时 ， 处 理 喜 不 会 从 外 部 获得 中 断 号 ， 
它 目 动 生成 中 断 号 人 码 2， 其 他 处 理 过 程 和 可 屏蔽 中 汤 相 同 。 


00008 
256 个 中 断 ，1KB 大 小 


00004 





中 断 随 时 可 能 及 生 ， 中 断 问 量 表 的 建立 和 初始 化 工作 是 由 BIOS 在 计 
算 机 局 动 时 负 贡 完成 的 。BIOS 为 每 个 中 断 号 填写 入 口 地 址 ， 因 为 它 不 知 
着 多数 中 断 处 理 程序 的 位 置 ， 所 以 ， 一 律 将 它们 指 同 一 个 相同 的 入 口 地 
址 ， 在 那里 ， 只 有 一 条 指令 : iret。 也 就 是 说 ， 当 这 些 中 断 发 生 时 ， 只 做 
一 件 事 ， 那 束 是 立即 人 返回 。 当 计算 机 局 动 后 ， 操 作 系 统 和 用 户 程 序 冉 根 
据 目 己 的 需要 ， 来 修改 东 些 中 断 的 入 口 地 址 ， 使 它 指 同 目 己 的 代码 。 握 
上 你 融会 看 到 ， 我 们 在 本 章 也 征 这 样 伏 的 。 


9.1.4 实时 时 钟 、CMOS RAM 和 BCD 编码 


也 许 你 曾经 党 得 奇怪 ， 为 什么 计算 机 能 够 准确 地 显示 日 期 和 时 间 ? 
原因 很 简单 ， 如 图 9-2 所 示 ， 在 外 围 设 备 控制 器 心 片 ICH 内 部 ， 集 成 了 实 
时 时 钟 电 路 (Real Time Clock，RTC ) 和 两 小 块 由 互补 金属 氧化 物 
(CMOS) 材料 组 成 的 静态 存储 器 (CMOS RAM) 。 实 时 时 钟 电 路 负责 
计时 ， 而 日 期 和 时 间 的 数值 则 存储 在 这 块 存储 右 中 。 


实时 时 钟 是 全 天 候 跳 动 的 ， 即 使 是 在 你 关 团 了 计算 机 的 电源 之 后 ， 
原因 在 于 它 由 主板 上 的 一 个 小 电池 提供 能 量 。 它 为 整 台 计算 机 提供 一 个 
基准 时 间 ， 为 所 有 需要 时 间 的 软件 和 硬件 服务 。 不 像 8259 心 片 ， 有 关 
RTC CMOS 的 资料 相当 少见 ， 很 不 容易 完整 地 找到 ， 而 8259 的 内 容 则 
铺天盖地 ， 到 处 都 是 。 所 以 ， 本 章 只 是 简要 地 介绍 8259， 而 尽量 多 说 一 
些 和 RTC 有 关 的 知识 。 

早期 的 计算 机 没有 ICH 已 片 ， 各 个 接口 单元 都 是 分 立 的 ， 单 独 地 焊 
在 主板 上 ， 并 彼此 连接 。 早 期 的 RTC 芯片 是 摩托 罗拉 (Motorola ) 
MS146818B， 现 在 直接 集成 在 ICH 内 ， 并 且 在 信号 上 与 其 兼容 。 除 了 日 
期 和 时 间 的 保存 功能 外 ，RTC 心 卢 也 可 以 提供 阅 钟 和 周期 性 的 中 断 功 
能 。 

日 期 和 时 间 信 息 是 保存 在 CMOS RAM 中 的 ， 通 常 有 128 字 节 ， 而 日 
期 和 时 间 信 息 只 占 了 一 小 部 分 容量 ， 其 他 空间 则 用 于 保存 整 机 的 配置 信 
轧 ， 比 如 各 种 人 硬件 的 类 型 和 工作 参数 、 开 机 窗 权 和 辅助 存储 设备 的 局 动 
顺序 等 。 这 些 参数 的 修改 通常 在 BIOS SETUP 开机 程序 中 进行 。 要 进入 
该 程序 ， 一 般 需 要 在 开机 时 按 DEL、ESC、F1、F2 或 者 F10 键 。 具 体 按 
哪个 键 ， 视 计算 机 的 广 家 和 品牌 而 定 。 


RTC 芯片 由 一 个 振荡 频率 为 32.768kHz 的 石英 晶体 振荡 器 〈 唱 振 ) 
了 驱动， 经 分 频 后 ， 用 于 对 CMOS RAM 进行 每 秒 一 次 的 时 间 刷 新 。 


如 表 9-1 所 示 ， 第 规 的 日 期 和 时 间 信 息 占 据 了 CMOS RAM 开始 部 分 
的 10 字 节 ， 有 有 年、 月、 日 和 时 、 分 、 秒 ， 报 警 的 时 、 分 、 秒 用 于 产生 到 
时 间 报 警 中 断 ， 如 果 它 们 的 内 容 为 0xC0 一 0xFF， 则 表示 不 使 用 报警 功 
能 。 

表 9-1 CMOS RAM 中 的 时 间 信 息 
偏 移 地 让 TE: 


TT 
E 


/ 
TT 
a 





CMOS RAM 的 访问 ， 需 要 通过 两 个 端口 来 进行 。0x70 或 者 0x74 是 
索引 问 口 ， 用 来 指定 CMOS RAM 内 的 单元 ; 0x71 或 者 0x75 是 数据 病 
口 ， 用 来 读 写 相 应 单元 里 的 内 容 。 举 个 例子 ， 以 下 代码 用 于 读 取 今天 是 
星期 几 : 


mMOY 去， 0X06 
Sut Ox70.a1 
人 9 区 类 


不 得 不 说 的 是 ， 从 很 早 的 时 候 开 始 ， 端 口 0x70 的 最 高 位 (bit7) 是 
控制 NMI 中 断 的 开关 。 当 它 为 0 时 ， 人 允许 NMI 中 断 到 达 处 理 器 ， 为 1 
时 ， 则 阻 断 所 有 的 NMI 信号 ， 其 他 7 个 比特 ， 即 0 一 6 位 ， 则 实际 上 用 于 
和 定 CMOS RAM 单元 的 索引 号 ， 这 种 规定 直到 现在 也 没有 改变 。 


如 图 9-4 所 示 ， 尺 官 问 口 0x70 的 位 7 不 是 中 断 信 号 ， 但 它 能 控制 与 
非 门 的 输出 ， 决 定 真 正 的 NMI 中 断 信 号 是 否 能 到 达 处 理 器 。 


RAM# (内 存 校 验 错 ) 
IOCHK# (1/O 校 验 错 ) 





处 理 噩 


RTC 端 口 0x70 
[0| 


图 9-4 ”端口 0x70 的 位 7 用 于 禁止 或 允许 NMI(〈 仅 为 示意 图 ) 








通 沿 来 说 ， 在 往 闹 口 0x70 写 入 索引 时 ， 应 当先 谈 取 0x70 原先 的 内 
容 ， 然 后 将 它 用 于 随后 的 写 索 引 操 作 中 。 但 是 ， 访 妆 口 是 只 写 的 ， 不 能 
用 于 讯 出 。 在 早期 的 系统 中 ， 计 算 机 的 制造 成 本 很 品 ， 为 了 最 大 化 地 利 
用 便 件 资源 ， 导 人 致 出 现 很 多 稀奇 古怪 的 做 法 ， 这 就 是 一 个 活生生 的 例 

为 了 解决 这 个 问题 ， 同 时 也 为 了 兼容 以 前 的 老式 人 硬件，ICH 已 厂 允 
许 通 过 切换 访问 模式 来 临时 取得 那些 只 写 寄存 器 的 内 容 ， 但 这 涉及 更 高 
层次 的 知识 ， 已 经 超出 了 当前 的 话题 范畴 。 现 在， 我 们 只 想 把 问题 搞 得 
简单 些 ， 这 么 说 吧 ，NMI 中 断 应 当 始 终 是 允许 的 ， 在 访问 RTC 时 ， 我 们 
直接 关闭 NMI， 访 问 结 束 后 ， 再 打开 NMI， 而 不 管 它 以 前 到 底 是 什么 样 
四。 


在 早期 ，CMOS RAM 只 有 64 字 节 ， 而 最 新 的 ICH 心 片 内 则 可 能 集 
成 了 256 字 节 有， 新 增 的 128 字 节 称 为 扩展 的 CMOS RAM。 当 然 ， 在 此 之 
亲 ， 要 先 确保 ICH 内 确实 存在 扩展 的 CMOS RAM。 


CMOS RAM 中 保存 的 日 期 和 时 间 ， 通 第 是 以 二 进 制 编码 的 十 进 制 数 
(Binary Coded Decimal，BCD) ， 这 是 默认 状态 ， 如 果 需 要 ， 也 可 以 
设置 成 按 正 和 常 的 二 进 制 数 来 表示 。 要 想 说 明 什么 是 BCD 编码 ， 最 好 的 办 
法 是 举 个 例子 。 比 如 十 进 制 数 25， 其 二 进 制 形 式 是 00011001。 但 是 ， 如 
果 采 用 BCD 编码 的 话 ， 则 一 个 字 节 的 高 4 位 和 低 4 位 分 别 独 立地 表示 一 
个 0 到 9 之 间 的 数字 。 因 此 ， 十 进 制 数 25 对 应 的 BCD 编码 是 
00100101。 由 此 可 以 看 出 ， 因 为 十 进 制 数 里 只 有 0 一 9， 故 用 BCD 编码 
的 数 ， 高 4 位 和 低 4 位 都 不 允许 大 于 1001， 人 否则 束 是 无 效 的 。 

单元 0x0A 一 0x0D 不 是 普通 的 存储 单元 ， 而 被 定义 成 4 个 寄存 人 右 的 过 
引号 ， 也 是 通过 0x70 和 0x71 这 两 个 端口 访问 的 。 这 4 个 寄存 需 用 于 设置 
实时 时 钟 电路 的 参数 和 工作 状态 。 

寄存 器 A 和 B 用 于 对 RTC 的 功能 进行 整体 性 的 设置 ， 它 们 都 是 8 位 
的 寄存 器 ， 可 读 可 写 ， 其 各 位 的 用 途 如 表 9-2 和 表 9-3 所 示 。 


表 9-2 寄存 器 A 各 位 功能 说 明 


比 特 位 


下 处 于 更 新 过 程 中 (Update In Progress，UIP )。 该 位 可 以 作为 一 个 状态 进行 监视 。CMOS RAM 中 的 时 间 
和 日 期 信息 会 由 RTC 周期 性 地 更 新 ， 在 此 期 间 ， 用 户 程序 不 应 当 访 问 它 们 。 对 当前 寄存 器 的 写 入 不 会 改变 
此 位 的 状态 

0: 更 新 周期 至 少 在 488 微 秒 内 不 会 启动 。 换 名 话说 ， 此 时 访问 CMOS RAM 中 的 时 间 、 日 历 和 闹钟 信息 
是 安全 的 

1: 正 处 于 更 新 周期 ， 或 者 马上 就 要 启动 

如 果 寄 存 器 B 的 SET 位 不 是 1， 而 且 在 分 频 电 路 已 正确 配置 的 情况 下 ， 更 新 周期 每 秒 发 生 一 次 。 在 此 期 
则 ， 会 增加 保存 的 日 期 和 时 间 、 检 查 数 据 是 否 因 超出 范围 而 溢出 (比如 ，31 号 之 后 是 下 月 1 号 ， 而 不 是 
32 与 )， 还 要 检查 是 否 到 了 半 钟 时 间 ， 最 后 ， 更 新 之 后 的 数据 还 要 写 回 原来 的 位 置 

更 新 周期 至 少 会 在 UIP 置 1 后 的 488us 内 开始 ， 而 且 整 个 周期 的 完成 时 间 不 会 多 于 1984 ps， 在 此 期 
间 ， 和 日 期 时 间 有 关 的 存储 单元 〈0x00 一 0x09) 会 暂时 脱离 外 部 总 线 。 为 避免 更 新 和 数据 遭 到 破坏 ， 可 以 
有 两 次 安全 地 从 外 部 访问 这 些 单元 的 机 会 : 当 检 测 到 更 新 结束 中 断 发 生 时 ， 可 以 有 差不多 999ms 的 时 间 用 
于 读 写 有 效 的 日 期 和 时 间 数 据 ， 如 果 检 测 到 寄存 器 A 的 UIP 位 为 低 (0)， 那 么 这 意味 着 在 更 新 周期 开始 
前 ， 至 少 还 有 488hs 的 时 间 


分 频 电路 选择 〈Division Chain Select) 。 这 3 位 控制 晶体 振 沪 器 的 分 频 电路 。 系 统 将 其 初始 化 到 010， 为 
RTC 选择 一 个 32.768kHz 的 时 钟 频率 

速率 选择 (Rate Select，RS)。 选 择 分 频 电路 的 分 节点 。 如 果 寄 和 存 右 B 的 PIE 位 被 设置 的 话 ， 此 处 的 选择 
将 产生 一 个 周期 性 的 中 断 信号 ， 否 则 将 设置 寄存 器 C 的 PF 标志 位 

0000: 从 不 触发 中 断 

0001: 3.90625 ms 

0010: 7.8125 ms 

0011: 122.070 us 

0100: 244.141 us 

0101: 488.281 us 

0110: 976.5625 hs 

0111: 1.953125 ms 

1000: 3.90625 ms 

1001: 7.8125 ms 

1010: 5.625 ms 

1011: 1.23 ms 

1100 = 62.3 ms 

1101: 125 ms 

1110: 250 ms 

1111: $500 ms 





表 9-3 寄存 器 B 各 位 功能 说 明 


更 新 半期 禁止 (Update Cycle Inhibit，SET)。 人 允许 或 者 禁止 更 新 周期 

0: 更 新 周 期 每 秒 都 会 正常 发 生 

1: 中 止 当前 的 更 新 周期 ， 并 且 此 后 不 再 产生 更 新 周期 。 此 位 置 1 时 ，BIOS 可 以 安全 地 初始 化 日 历 和 时 间 
周期 性 中 断 允 许 (Periodic Interrupt Enable，PIE ) 

0: 不 允许 

1: 当 达 到 寄存 器 A 中 RS 所 设 定 的 时 间 基 准时 ， 人 允许 产生 中 断 
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> 
更 新 结束 中 断 允 许 (Update-Ended Interrupt Enable，UIE) 

4 0: 不 允许 
1: 允许 在 每 个 更 新 冉 期 结束 时 产生 中 断 

_ 方 波 允 许 〈Square Wave Enable，SQWE) 

| 该 位 空 看 不 用 ， 只 是 为 了 和 早期 的 Motorola 146818B 实时 时 钟 蕊 片 保持 一 致 
数据 模式 (Data Mode，DM) 

该 位 用 于 指定 二 进 制 或 者 BCD 的 数据 表示 形式 


0: BCD 


间 钟 中 断 允 许 (Alarm Interrupt Enable,，AIE) 
0: 不 允许 
1: 人 允许 更 新 周期 在 到 达 闹 点 并 将 AF 置 位 的 同时 ， 发 出 一 个 中 断 


1: Binary 


了 
小 时 格式 (Hour Format,，HOURFORM) 

] 0: 12 小 时 制 。 在 这 种 模式 下 ， 第 7 位 为 0 表示 上 午 (AM)， 为 1 表示 下 午 (PM) 
1: 24 小 时 人 制 


老 软 件 的 夏令 时 文 持 (Daylight Savings Legacy Software Support，DSLSWS ) 
该 功能 已 不 再 文 持 ， 该 位 仅 用 于 维持 对 老 软 件 的 支持 ， 并 且 是 无 用 的 


寄存 器 C 和 D 是 标志 寄存 器 ， 这 些 标志 反映 了 RTC 的 工作 状态 ， 寄 
仓 部 C 是 只 读 的， 寄存 器 D 则 可 读 可 写 ， 它 们 也 痢 古 8 位 奇 存 器 ， 其 各 位 
的 舍 义 如 表 9-4 和 表 9-5 所 示 。 特 唱和 是 寄存 器 C， 因 为 RTC 可 以 产生 中 
断 ， 当 中 断 产 生 时 ， 可 以 通过 该 寄存 咽 采 识别 中 断 的 原因 ， 比 如 ， 征 周 
期 性 的 中 断 ， 还 是 曾 钟 中 断 。 


表 9-4 寄存 器 C 各 位 功能 说 明 





中 断 请 求 标志 (Interrupt Request Flag，IRQF) 

IRQF= (PFXPIE) 十 (AFXAIE) 十 (UFX UFE) 

以 上 ， 加 号 表示 逻辑 或 ， 乘 号 表示 逻辑 与 。 该 位 被 设置 时 ， 表 示 肯 定 要 发 生 中 断 。 对 寄存 器 C 的 读 操作 
将 导致 此 位 清 零 

周期 性 中 断 标志 (Periodic Interrupt Flag，PF )。 

若 寄 存 器 A 的 RS 位 为 0000， 则 此 位 是 0， 否则 是 1。 对 寄存 器 C 的 读 操作 将 导致 此 位 清 零 

注 : 程序 可 以 根据 此 位 来 判断 RTC 的 中 断 原 因 


闹钟 标志 〈Alarm Flag，AF )。 

当 所 有 闪 点 同 当前 时 间 相 符 时 ， 此 位 是 1。 对 寄存 器 C 的 读 操 作 将 导致 此 位 清 零 

注 : 程序 可 以 根据 此 位 来 判断 RTC 的 中 断 原 因 

更 新 结束 标志 (Update-Ended Flag，UF ) 

紧 接着 每 秒 一 次 的 更 新 周期 之 后 ，RTC 电路 立即 将 此 位 置 1。 对 寄存 器 C 的 读 操作 将 导致 此 位 清 零 
注 : 程序 可 以 根据 此 位 来 判断 RTC 的 中 断 原 因 


保留 ， 总 是 报告 0 





表 9-5 寄存 器 D 各 位 功能 说 明 


有 效 RAM 和 时 间 位 (Valid RAM and Time Bit，VRT) 


在 写 周期 ， 此 位 应 当 始 终 写 0。 不 过 ， 在 读 周 期 ， 此 位 回 到 1。 在 RTC 加 电 正 常 时 ， 此 位 被 价 件 强制 为 1 
保留 。 总 是 返回 0。 并 且 在 写 周 期 总 是 置 0 





讲 了 这 么 多 和 8259 以 及 RTC 有 有关 的 内 容 ， 现 在 ， 我 们 想 让 RTC 心 
片 定 期 发 出 一 个 中 断 ， 当 这 个 中 断 发 生 的 时 候 ， 还 能 执行 我 们 目 己 编写 
的 代码 ， 来 访问 CMOS RAM， 在 屏幕 上 显示 一 个 动态 走动 的 时 钟 。 


9.1.5 ”代码 清单 9-1 


本 章 有 配套 的 汇编 语言 源 程序 ， 并 围绕 这 些 源 程 序 进 行 讲解 ， 请 对 照 阅 读 。 
本 章 代 码 清单 : 9-1( 被 加 载 的 用 户 程 序 ) ， 源 程序 文件 : c09_1.asm 


9.1.6 ”初始 化 8259、RTC 和 中 断 向 量 表 
本 章 提供 的 代码 清单 中 ， 没 有 加 载 器 程序 。 这 是 因为 可 以 利用 上 一 
章 提供 的 加 载 器 来 加 载 用 户 程序 ， 只 要 符合 规则 ， 加 载 器 是 通用 的 。 


用 户 程 序 的 入 口 点 在 代码 清单 9-1 的 第 119 行 ， 从 这 一 行 开 始 ， 到 第 
124 行 ， 用 于 初始 化 各 个 段 宥 存 大 的 内 容 。 下 面 开 始 在 中 断 问 量 表 中 安 


普 实 时 时 钟 中 断 的 入 口 点 。 既 然 本 章 的 主题 是 中 断 ， 那 么 束 很 有 必要 强 
调 一 件 事 。 当 处 理 占 执行 任何 一 条 改变 栈 段 寄存 此 SS 的 指令 时 ， 它 会 在 
下 一 条 指令 执行 完 期 间 茶 止 中 断 。 

栈 无 疑 是 很 重要 的 ， 不 能 被 破坏 。 要 想 改变 代码 段 和 数据 段 ， 只 需 
要 改变 段 守 和 存 莫 束 可 以 了 。 但 栈 段 不 同 ， 因 为 它 际 了 有 上 段 寄 和 存 占 ， 人 还 有 
栈 指针 。 因 此 ， 绝 大 多 数 时 候 ， 对 栈 的 改变 是 分 两 步 进行 的 先 改 变 段 
寄 和 存货 SS 的 内 容 ， 接 看 义 修 改 栈 指针 寄存 郁 SP 的 内 容 。 


轧 象 一 下 ， 如 采 刚 刚 修改 了 段 寄 人 存 希 SS， 在 还 设 来 得 及 修改 SP 的 
情况 下 ， 束 肥 生 了 中 断 ， 会 出 现 什 么 后 果 ， 而 且 要 知道 ， 中 靳 十 需要 依 
徘 栈 来 工作 的 。 


因此 ， 处 理 器 在 设计 的 时 候 束 规定 ， 当 过 到 修改 段 寄 存 絮 SS 的 指令 
时 ， 在 这 条 指令 和 下 一 条 指令 执行 完毕 期 间 ， 茶 止 中 断 ， 以 此 来 保护 
栈 。 换 句 话说 ， 你 应 该 在 修改 段 寄存 器 SS 的 指令 之 后 ， 紧 跟着 一 条 修改 
栈 指针 SP 的 指令 。 

就 代码 清单 9-1 来 说 ， 在 第 121、122 行 执行 期 间 ， 处 理 器 禁止 中 
断 。 再 比如 以 下 指令 : 


Bush es 
BoB. SS 


moVv sp,0 


在 后 面 两 行 指 令 执行 期 间 ， 处 理 右 荣 止 中 靳 。 


RTC 芯片 的 中 断 信 号 ， 通 同 中 断 控制 器 8259 从 片 的 第 1 个 中 断 引 脚 
IRO0。 在 计算 机 启动 期 间 ，BIOS 会 初始 化 中 断 控 制 器 ， 将 主 片 的 中 断 吕 
设 为 从 0x08 开始 ， 将 从 片 的 中 断 写 设 为 从 0x70 开 始 。 所 以 ， 计 算 机 局 动 
后 ，RTC 芯片 的 中 断 号 默认 是 0x70。 尽 管 我 们 可 以 通过 对 8259 编程 来 
改变 它 ， 但 是 没有 必要 。 

检测 点 9.2 

在 Bochs 中 使 用 "xp" 命 令 显 示 实 模式 下 的 中 断 问 量 表 ， 并 找 出 0x70 
写 中 汤 处 理 过 程 的 段 地 址 和 偏 移 地 址 。 

在 安装 中 断 问 量 之 前 ， 应 该 先 显 示 些 什么 。 第 126 一 130 行 ， 显 示 两 
行 提 示人 信息， 表明 正在 安装 中 断 向 量 。 这 两 个 字符 串 位 于 第 286 行 的 数 


据 段 中 。 对 于 过 程 put_string 没有 什么 好 次 的 ， 它 的 代码 和 上 一 草 相 同 ， 
工作 过 程 更 没有 区 别 。 

为 了 修改 东 中 断 在 中 断 问 量 表 中 的 登记 项 ， 需 要 和 允 找 到 它 。 第 132 一 
135 行 ， 将 中 断 亏 0x70 乘 以 4， 驶 是 它 在 中 断 问 量 表 内 的 偶 移 。 


第 137 行 ， 修 改 中 断 问 量 表 时 ， 需 要 先 用 cli 指令 清 中 断 。 当 表 项 信 
息 只 修改 了 一 部 分 时 ， 如 果 发 生 0x70 号 中 断 ， 则 会 产生 不 可 预料 的 问 
题 。 
第 139 一 141 行 ， 将 段 寄 存 器 ES 压 栈 和 暂时 保存 ， 并 使 它 指向 中 断 轴 
量 表 〈 上 所 在 的 段 ) 。 


接 看 ， 第 142 一 145 行 ， 访 问 中 断 癌 量 表 内 0x70 气 中 断 的 表 项 ， 分 
列 写 入 新 中 断 处 理 过 程 的 偶 移 地 址 和 段 地 址 。 新 的 中 断 处 理 过 程 定 从 标 
号 new_int_0x70 处 开始 的 ， 而 且 位 于 当前 代 但 段 内 。 所 以 ， 访 中 断 处 理 
过 程 的 偏 移 地 址 就 是 标号 new_int_0x70 的 汇编 地 址 〈 注 意 ， 段 code 的 
定义 中 市 有 vstart=0 子 句 ) ， 上 段 地 址 束 是 当前 段 寄 存 右 CS 的 内 容 。 表 项 
修改 完毕 ， 从 栈 中 恢复 段 寄 存 右 ES 的 原始 内 容 。 


接 下 来 ， 我 们 要 设置 RTC 的 工作 状态 ， 使 它 能 够 产生 中 断 信 号 给 
8259 中 断 控制 器 。 


RTC 到 8259 的 中 断 线 只 有 一 根 ， 而 RTC 可 以 产生 多 种 中 新 。 比 如 
闸 钟 中 断 、 更 新 结束 中 断 和 周期 性 中 断 〈 人 参见 表 9-3 和 表 9-4) 。RTC 的 
计时 《更 新 周期 ) 是 独立 的 ， 产 生 中 断 信 号 只 是 它 的 一 个 赠品 。 所 以 ， 
如 果 和 希望 它 能 产后 中断 信号 ， 需 要 额外 设置 。 

以 上 所 说 的 三 种 中 断 ， 我 们 只 要 设置 一 种 束 可 以 了 。 其 实 ， 最 人 简 早 
的 束 是 设置 更 新 周期 结束 中 汤 。 每 当 RTC 更 新 了 CMOS RAM 中 的 日 期 
和 时 间 后 ， 将 发 出 此 中 断 。 更 新 周期 每 秒 进 行 一 次 ， 因 此 该 中 断 也 每 秒 
发 生 一 次 。 

为 了 设置 该 中 断 ， 代 码 清单 9-1 第 147 行 ， 将 RTC 寄存 器 B 的 索引 
0x0b 传送 到 寄存 器 AL。 在 访问 RTC 期 间 ， 最 好 是 阻 断 NMI， 因 此 ， 第 
148、149 行 ， 先 用 or 指令 将 AL 的 最 高 位 置 1， 再 写 端口 0x70。 

第 150、151 行 ， 用 于 通过 数据 端口 0x71 写 寄 存 器 B。 写 的 内 容 是 
0x12， 其 二 进 制 形式 为 00010010， 对 照 表 9-3， 其 意义 不 难 理 解 . 允许 
更 新 周期 上 照常 发 生 ， 禁 目 周 期 性 中 断 ， 禁 止 闹钟 功能 ， 人 允许 更 新 周期 结 
束 中 断 ， 使 用 24 小 时 制 ， 日 期 和 时 间 采 用 BCD 编码 。 


每 次 当中 断 实 际 发 生 时 ， 可 以 在 程序 “中断 处 理 过 程 ) 中 读 寄 存 器 C 
的 内 容 来 检查 中 断 的 原因 。 比 如 ， 每 当 更 新 周期 结束 中 断 发 和 后 时 ，RTC 
就 将 它 的 第 4 位 置 1。 访 寄存 器 还 有 一 个 特点 ， 束 是 每 次 读 取 它 后 ， 所 有 
内 容 自 动 清 零 。 而 且 ， 如 果 不 读 取 它 的 话 〈 换 名 话说 ， 相 应 的 位 没有 清 
零 ) ， 同 样 的 中 断 将 不 再 产生 。 

为 此 ， 第 153 一 155 行 ， 读 一 下 寄存 右 C 的 内 容 ， 使 之 开始 产生 中 断 
信号 。 注 意 ， 在 问 索 引 端 口 0x70 写 入 的 同时 ， 也 打开 了 NMI。 上 毕竟， 这 
是 最 后 一 次 在 主 程序 中 访问 RTC。 

当然 ， 如 果 采 用 周期 性 中 断 而 不 是 更 新 闻 期 结束 中 断 ， 则 稍微 拷 烦 
一 些 ， 因 为 要 设置 分 频 电 路 的 分 节点 。 以 下 代码 片断 用 于 产生 2 次 / 秒 的 
周期 性 中 断 : 


mov al,0x0a 

or ‘al x80 

out, Ox170;a1 

入 

Sr 1 二 ;设置 RTC 寄存 器 A， 使 其 每 秒 发 生 2 次 中 断 
out, Ox (Lal 


除 此 之 外 ， 还 要 设置 寄存 器 B 的 PIE 位 ， 以 允许 周期 性 中 晰 。 

RTC 芯片 设置 完毕 后 ， 再 来 打通 它 到 8259 的 最 后 一 道 屏障 。 正 常情 
况 下 ，8259 是 不 会 允许 RTC 中 断 的 ， 所 以 ， 需 要 修改 它 内 部 的 中 断 屏 蔽 
寄存 器 IMR。IMR 是 一 个 8 位 寄存 器 ， 位 0 对 应 着 中 断 输 入 引 脚 IRO， 位 7 
对 应 着 引 脚 IR7， 相 应 的 位 是 0 时 ， 人 允许 中 断 ， 为 1 时 ， 关 掉 中 断 。 

8259 心 片 是 我 见 过 的 尽 上 中， 访问 起 来 最 国 烦 ， 也 是 我 最 讨厌 的 一 
个 。 好 在 有 关 它 的 资料 非常 好 找 ， 这 里 就 简单 地 进行 讲解 。 代 码 清 单 9-1 
第 157 一 159 行 ， 通 过 端口 0xa1 读 取 8259 从 片 的 IMR 寄存 器 ， 用 and 指 
令 清 除 第 0 位 ， 其 他 各 位 保持 原状 ， 然 后 再 写 回 去 。 于 是 ，RTC 的 中 断 
可 以 被 8259 处 理 了 。 

第 161 行 ，sti 指令 将 标志 寄存 器 的 IF 位 置 1， 开 放 设 备 中 断 。 从 这 
个 时 候 开 始 ， 中 断 随时 都 会 发 生 ， 也 随时 会 被 处 理 。 


9.1.7 ”使 处 理 器 进入 低 功 耗 状态 


RTC 更 新 周期 结束 中 断 的 处 理 过 程 可 以 看 成 另 一 个 程序 ， 征 独立 的 
处 理 过 程 ， 走 额外 的 执行 流程 ， 它 随时 部会 友 生 ， 但 和 主 程序 互 不 相 
干 。 关 于 它 的 执行 过 程 ， 马 上 融 要 讲 到 ， 现 在 继续 来 看 主 程序 。 


在 为 中 断 过 程 做 了 初始 化 工作 之 后 ， 主 程序 还 是 要 继续 执行 的 。 代 
伺 清 单 9-1 第 163 一 167 行 ， 用 于 显示 中 断 处理 程 序 已 安装 成 功 的 消息 。 


接着 ， 第 169 一 171 行 ， 使 段 寄 存 器 DS 指 问 显示 绥 冲 区 ， 并 在 屏 希 
上 的 第 12 行 33 列 显 示 一 个 字符 "@”， 该 位 置 差不多 是 整个 屏幕 的 中 心 。 
表达 式 12*160 + 33*2 是 在 指令 编译 阶段 计算 的 ， 是 该 字符 在 显存 中 的 位 
置 。 每 个 字符 在 显存 中 占 2 字 节 的 位 置 ， 每 行 80 个 字符 。 

在 此 之 后 ， 主 程序 就 无 事 可 做 了 。 第 174 行 ，hlt 指令 使 处 理 器 停止 
执行 指令 ， 并 处 于 停机 状态 ， 这 将 降低 处 理 喜 的 功 耗 。 处 于 停机 状态 的 
处 理 器 可 以 被 外 部 中 断 唤醒 并 恢复 执行 ， 而 且 会 继续 执行 hlt 后 面 的 指 


令 。 


所 以 ， 第 174 一 176 行 用 于 形成 一 个 循环 ， 先 是 停机 ， 接 看 未 个 外 部 
中 晰 使 处 理 如 恢复 执行 。 一 旦 处 理 帮 的 执行 扣 来 到 hlt 指令 之 后 ， 则 立即 
使 它 继续 处 于 俘 机 状态 。 


第 175 行 ， 使 用 not 指令 将 字符 人 @ 的 显示 属性 反 转 。not 是 按 位 取 反 
指令 ， 其 格式 为 


not r/m8 


有 人 二 76 


not 指令 执行 时 ， 会 将 操作 数 的 每 一 位 反 转 ， 原 来 的 0 变 成 1， 原 来 
的 1 变 成 0。 比 如 : 


mowv al-Oxlft 


Boel ;执行 后 ，AL 的 内 容 为 0xe0 


从 显示 效果 上 看 ， 循 环 将 显示 属性 反 转 将 取得 一 个 动画 效果 ， 可 以 
很 清楚 地 看 到 处 理 器 每 次 从 停机 状态 被 唤醒 的 过 程 。not 指令 不 影响 任何 
标志 位 。 

相对 于 jmp $ 指 令 ， 使 用 hit 指令 会 大 大 降低 处 理 器 的 占用 率 ， 
Windows 7 操作 系统 有 一 个 叫做 CPU 仪表 盘 的 小 工具 ， 当 使 用 jmp $ 指 
令 时 ， 你 会 看 到 处 理 器 占用 率 是 100%， 而 在 一 个 循环 中 使 用 htt 指令 


时 ， 该 占用 率 马上 降 到 10% 左 右 ， 这 还 是 在 虚拟 机 环境 下 ， 毕 竟 宿 主 操 
作 系统 还 要 占用 处 理 器 时 间 。 


9.1.8 ”实时 时 钟 中 断 的 处 理 过 程 


主 程序 束 是 这 样 了 ， 俘 机 、 执 行 ， 接 痢 停机 。 与 此 同时 ， 中 断 也 在 
个 俘 地 及 生 看 ， 处 理 带 还 要 抽出 空 来 执行 中 断 处 理 过 程 ， 下 面 吏 来 看 看 
RTC 的 更 新 周期 结束 中 断 处 理 ， 坊 中 断 处 理 过 程 从 代码 清单 9-1 的 第 27 
行 开 始 。 

第 28 一 32 行 ， 先 你 护 好 现场 ， 将 后 面 用 到 的 寄存 问 压 栈 人 和 存 。 这 一 
氮 特 别 重 要 ， 中 断 处 理 过 程 必 须 无 痕 地 执行 ， 你 不 知道 中 断 会 在 什么 时 
候 上 肥 生 ， 也 不 知道 中 断 及 生 时 ， 哪 一 个 程序 正在 执行 ， 所 以 ， 必 须 保证 
中 断 返 回 时 ， 能 还 原 中 断 前 的 状态 。 


第 34 一 40 行 ， 用 于 读 RTC 寄存 器 A， 根 据 UIP 位 的 状态 来 决定 是 等 
符 更 新 周期 结束 ， 还 是 继续 往 下 执行 。UIP 位 为 0 表示 现在 访问 CMOS 
RAM 中 的 日 期 和 时 间 是 安全 的 。 注 意 第 36 行 ， 用 于 把 寄存 器 AL 的 最 高 
位 置 1， 从 而 阻 晰 NMI。 当 然 ， 这 是 不 必要 的 ， 当 NMI 发 生 时 ， 整 个 计算 
机 都 应 当 停 止 工 作 ， 也 不 在 乎 中 断 处 理 过 程 能 个 正 党 执行 。 

第 38 行 从 数据 端口 读 取 寄存 器 A 的 内 容 ; 第 39 行 ，test 指令 用 于 测 
试 寄存 器 AL 的 第 7 位 是 否 为 1。 

“test” 的 意思 是 “测试 "。 顾 名 思 义 ， 可 以 用 这 条 指令 来 测试 某 个 寄存 
器 ， 或 者 内 存单 元 里 的 内 容 是 否 市 有 某 个 特征 。 

test 指令 在 功能 上 和 and 指令 是 一 样 的 ， 都 是 将 两 个 操作 数 按 位 进行 
逻辑 “与 "， 并 根据 结果 设置 相应 的 标志 位 。 但 是 ，test 指令 执行 后 ， 运 算 
结果 被 丢弃 (不 改变 或 破坏 两 个 操作 数 的 内 容 〉。 

test 指令 需要 两 个 操作 数 ， 其 指令 格式 为 


test r/m8,imm8 
test r/ml6, immle 
test /nm8 8 
test r/ml16, YL6 


和 and 指令 一 样 ，test 指令 执行 后 ，OF 二 CF 二 0; 对 ZF、SF 和 PF 
的 影响 视 测试 结果 而 定 ， 对 AF 的 影响 未 定义 。 对 于 test 指令 的 应 用 ， 这 


里 有 一 个 例子 ， 比 如 ， 我 们 想 测 试 Al 寄存 器 的 第 3 位 是 “0" 还 是 “位 ， 可 以 
这 任 纺 与 代位 : 


test al, 0x08 


0x08 的 二 进 制 形式 为 00001000， 它 的 第 3 位 是 “1”， 表 明 我 们 关注 的 是 
这 一 位 。 不 省 寄存 上 器 AL 中 的 内 容 是 什么 ， 只 要 它 的 第 3 位 是 “0”"， 这 条 指 
邻 执 行 后 ， 结 果 一 定 是 00000000， 标 志 位 ZF==1; 
相反 ， 如 果 寄 存 器 AL 的 第 3 位 是 “1”"， 那 么 结果 一 定 是 00001000，ZF= 
0。 于 是 ， 根 据 ZF 标志 位 的 情况 ， 束 可 以 判定 寄存 右 AL 中 的 第 3 位 是 “0” 
人 还是 “1”。 

第 40 行 ， 如 果 UIP 位 是 0， 那 么 测试 的 结果 是 ZF 二 1， 继 续 往 下 执行 
第 42 行 ， 否则 ， 说 明 UIP 位 是 1， 需 要 返回 到 第 34 行 继 续 等 待 RTC 更 新 
周期 结束 。 


正常 情况 下 ， 访 问 CMOS RAM 中 的 日 期 和 时 间 ， 必 须 等 待 RTC 更 
新 周期 结束 ， 所 以 上 面 的 判断 过 程 是 必需 的 ， 而 这 些 代 人 码 也 适用 于 正常 
的 访问 过 程 。 但 是 ， 当 前 中 断 处 理 过 程 是 针对 更 新 周期 结束 中 断 的 ， 而 
当 此 中 断 发 生 时 ， 本 身 就 说 明 对 CMOS RAM 的 访问 是 安全 的 ， 毕 竟 留 给 
我 们 的 时 间 是 999 军 秒 ， 这 上 段 时 间 非 党 充裕， 这 段 时 间 能 执行 千 万 条 指 
令 。 所 以 ， 在 这 种 特定 的 情况 下 ， 上 面 的 判断 过 程 是 不 必要 的 。 当 然 ， 
加 上 倒 也 无 所 谓 。 

第 42 一 52 行 ， 分 别 访问 CMOS RAM 的 0、2、4 号 单元 ， 从 中 读 取 
当前 的 秒 、 分 、 时 数据 ， 抽 顺序 压 栈 等 竺 后 续 操 作 。 

第 60 一 62 行 ， 读 一 下 RTC 的 寄存 右 C， 使 得 所 有 中 断 标 志 复 位 。 这 
等 于 是 告诉 RTC， 中 断 已 经 得 到 处 理 ， 可 以 继续 下 一 次 中 断 。 和 否则 的 
话 ，RTC 看 到 中 晰 未 被 处 理 ， 将 不 再 产生 中 断 信 号 。RTC 产生 中 断 的 原 
因 有 多 种 ， 可 以 在 程序 中 通过 读 寄 存 需 C 来 判断 具体 的 原因 。 不 过 这 里 
不 需要 ， 因 为 除了 更 新 周期 结束 中 断 外 ， 其 他 中 断 都 航 关 闭 了 。 

现在 ， 终 于 可 以 在 屏幕 上 显示 时 间 信 息 了 。 

第 64、65 行 ， 临 时 将 段 寄 存 器 ES 指 癌 显示 绥 冲 区 。 

第 67、68 行 ， 首 先 从 栈 中 弹出 小 时 数 ， 调 用 过 程 bcd to_ascii 来 将 
用 BCD 码 表 示 的 “小 时 ”转换 成 ASCII。 该 过 程 是 在 第 105 行 定 义 的 ， 调 用 


该 过 程 时 ， 寄 存 器 AL 中 的 高 4 位 和 低 4 位 分 别 是 “小 时 ”的 十 位 数字 和 个 位 
数字 。 

第 108 行 ， 将 寄存 需 AL 中 的 内 容 复 制 一 份 给 AH， 以 方便 下 一 步 操 
作 。 

第 109、110 行 ， 将 寄存 器 AL 中 的 高 4 位 清 零 ， 只 留 下 “小 时 ”的 个 位 
数字 。 接 着 ， 将 它 加 上 0x30， 就 得 到 该 数字 对 应 的 ASCII 码 。 

十 位 上 的 数字 在 寄存 器 AH 的 高 4 位 。 第 112 行 ， 用 右 移 4 位 的 方 
法 ， 将 它 “ 拉 ”到 低 4 位 ， 高 4 位 在 移动 的 过 程 中 自动 清 零 。 

接着 ， 第 113、114 行 ， 用 同样 的 办 法 来 得 到 十 位 数字 的 ASCI 码 。 
此 时 ， 寄 存 器 AH 中 是 十 位 数字 的 ASCI 码 ，AL 中 是 个 位 数字 的 ASCII 
码 ， 它 们 将 作为 结果 返回 给 调用 者 。 

最 后 ， 第 116 行 用 于 返回 调用 者 。 


接着 回 到 第 69 行 ， 为 了 连续 在 屏幕 上 显示 内 容 ， 最 好 是 采用 基 址 寻 
址 来 访问 显存 。 这 一 行 用 于 指定 显示 的 内 容 位 于 显存 的 什么 位 置 。 实 际 
上 ， 这 里 指定 的 是 第 12 行 36 列 。 同 以 前 一 样 ， 每 个 字符 在 显存 中 占 两 个 
字 节 ， 每 行 80 个 字符 ， 所 以 这 里 使 用 了 表达 式 12*160 + 36*2， 该 表达 式 
的 值 是 在 编译 阶段 计算 的 。 

第 71、72 行 ， 分 别 将 "小 时 ?的 两 个 数位 写 到 显存 中 ， 段 地 址 在 ES 
中 ， 偏 移 地 址 分 别 是 由 寄存 器 BX 和 BX+2 提供 的 。 这 里 没有 写 入 显示 属 
性 ， 这 是 因为 我 们 希望 采用 默认 的 显示 属性 〈 屏 幕 是 黑 的 ， 默 认 的 显示 
属性 是 0x07， 即 黑 底 白字 ) 。 

第 74、75 行 ， 用 于 在 下 一 个 屏 芭 位 置 显 示 冒 写 “:*， 这 是 在 显示 时 间 
时 都 会 采用 的 分 隔 符 。 当 然 ， 通 过 寄存 器 AL 中 转 是 多 余 的 ， 这 两 句 可 以 
直接 写成 


mov byte [es:bx+4], : 
遗憾 的 是 ， 等 我 发 现 这 个 问题 时 ， 本 章 已 经 快要 写 完 了 ， 重 新 排版 
实在 太 费 工夫 。 其 实 ， 这 不 算是 个 问题 ， 无 念 大雅 ， 难 道 不 是 吗 ” 


为 了 验证 RTC 更 新 结束 中 断 征 每 秒 友 生 一 次 的 ， 第 76 行 ， 将 上 冒 志 的 
显示 属性 《颜色 ) 用 not 指 令 反 转 。 束 像 手 掌 的 两 面 一 样 ， 每 次 肥 生 中 断 


时 ， 冒 号 的 凑 色 将 和 上 一 次 相反 ， 但 永远 在 两 个 属性 之 间 来 回 变 化 。 到 
程序 运行 的 时 候 你 惑 会 友 现 ， 变 化 的 频率 是 每 秒 一 次 。 


剩 下 的 指令 都 很 好 理解 ， 因 为 它们 的 工作 是 按 相 同 的 方法 显示 分 钟 
数 和 秒 数 。 第 78 一 90 行 ， 依 次 从 栈 中 弹出 分 钟 和 秒 的 数值 ， 并 转换 成 
ASCII 人 码 ， 然 后 显示 在 屏 积 上 ， 中 辐 用 冒号 间隔 。 


在 8259 心 户 内部， 有 一 个 中 断 服务 寄存 右 〈lInterrupt Service 
Register，ISR) ， 这 是 一 个 8 位 寄存 器 ， 每 一 位 都 对 应 着 一 个 中 疡 输入 
引 脚 。 当 中 断 处 理 过 程 开 始 时 ，8259 芯片 会 将 相应 的 位 置 1， 表 明正 在 
服务 从 该 引 脚 来 的 中 断 。 


一 且 啊 应 了 中 断 ，8259 中 断 控 制 疮 无 法 知道 该 中 断 什 么 时 候 才 能 处 
理 结束 。 同 时 ， 如 果 不 清 除 相 应 的 位 ， 下 次 从 同一 个 引 脚 出 现 的 中 断 将 
得 不 到 处 理 。 在 这 种 情况 下 ， 需 要 程序 在 中 断 处 理 过 程 的 结尾 ， 显 式 地 
对 8259 心 族 编 程 来 清除 该 标志 ， 方 法 是 向 8259 心 片 发 送 中 断 结束 命 令 
(End Of Interrupt，EOI) 。 

中 断 结 束 命令 的 代码 是 0x20。 代 码 清单 9-1 第 92 一 94 行 就 用 来 做 这 
件 事 。 需 要 注 是 的 是 ， 如 末 外 部 中 断 是 8259 主 片 处 理 的 ， 那 么 ，EOI 命 
令 仅 发 送 给 主 片 即 可 ， 端 口号 是 0x20， 如 果 外 部 中 断 是 由 从 片 处 理 的 ， 
束 像 本 章 的 例子 ， 那 么 ，EOI 命令 既 要 及 往 从 请 《交口 号 0xa0) ， 也 要 
发 往 主 片 。 

最 后 ， 第 96 一 102 行 ， 从 栈 中 恢复 被 中 靳 程序 的 现场 ， 并 用 中 肠 返 
回 指令 iret 回 到 中 断 之 前 的 地 方 继 续 执行 。iret 的 意思 是 Interrupt 
Return 。 


9.1.9 ”代码 清单 9-1 的 编译 和 运行 


本 章 的 代码 不 包括 加 载 器 ， 也 束 是 负责 加 载 用 户 程 序 的 主 引 导 局 区 
代码， 因为 第 8 章 己 经 提供 了 一 个 加 载 嚣 ， 它 同样 可 以 加 载 本 章 的 用 户 程 
序 。 

在 完全 理解 了 代码 清单 9-1 的 基础 上 ， 可 以 自行 编辑 和 编译 它 ， 生 成 
二 进 制 文件 。 然 后 ， 使 用 FixVhdWr 工具 将 其 写 入 虚拟 硬盘 。 和 第 8 章 一 
样 ， 写 入 时 的 起 始 逻 辑 扇 区 号 是 100， 毕 竟 加 载 器 每 次 要 从 这 个 地 方 读 取 
和 加 载 用 户 程序 。 


一 旦 所 有 工作 都 准备 停 当 ， 即 可 局 动 虚拟 机 来 观察 运行 结 未 。 通 
情况 下 ， 运 行 结 来 会 如 图 9-5 所 示 。 


丝 





LEARN-ASM [正在 运行 ] - Oracle VM VirtualBox 一 | 回 | 交 








ed mE 转 Right Ctrl 


图 9-5 ”代码 清单 9-1 编译 和 运行 后 的 显示 效果 


在 你 欣赏 程序 的 运行 结果 时 ， 你 一 定 会 发 现时 间 每 秒 更 新 一 次 ， 这 
从 时 写 的 显示 属性 每 秒 反 转 一 次 可 以 看 出 来 。 与 此 不 同 的 是 ， 字 从 “@" 却 
以 很 使 的 速度 在 内 烁 。 这 意味 着 ， 把 处 理 右 从 停机 状态 唤醒 的 不 单单 旦 
实时 时 钟 的 更 新 周期 结束 中 断 ， 还 有 其 他 合 件 中 断 ， 只 不 过 我 们 不 知道 
征 谁 而 已。 


9.2 内 部 中 上 断 


和 硬件 中 断 不 同 ， 内 部 中 断 发 生 在 处 理 器 内 部 ， 是 由 执行 的 指令 引 
起 的 。 比 如 ， 当 处 理 器 检测 到 div 或 者 idiv 指令 的 除数 为 零 时 ， 或 者 除法 
的 结果 溢出 时 ， 将 产生 中 断 0 (0 号 中 断 ) ， 这 就 是 除法 错 中 断 。 

再 比如 ， 当 处 理 器 遇 到 非法 指令 时 ， 将 产生 中 断 6。 非 法 指令 是 指 指 
令 的 操作 人 码 没 有 定义 ， 或 者 指令 超过 了 规定 的 长 度 。 操 作 码 没有 定义 通 
向 章 味 看 那 不 是 一 条 指令 ， 而 是 普通 的 数 。 

内 部 中 断 不 受 标 志 寄 存 器 IF 位 的 影响 ， 也 不 需要 中 断 识 别 总 线 局 
期 ， 它 们 的 中 断 类 型 是 固定 的 ， 可 以 立即 转 入 相应 的 处 理 过 程 。 


9.3 软 中 上 


软 中 断 是 由 int 指令 引起 的 中 断 处 理 。 这 类 中 断 也 不 需要 中 断 识别 总 
线 周期 ， 中 断气 在 指令 中 给 出 。int 指令 的 格式 如 下 : 


TITLE 
int Imm8 


Trt 


int3 是 断 点 中 靳 指令 ， 机 器 指令 公 为 CC。 这 条 指令 在 调试 程序 的 时 
候 很 有 用 ， 当 程序 运行 不 正常 时 ， 多 数 时 候 希 望 在 菜 个 地 方 设置 一 个 检 
得 点 ， 也 称 断 点 ， 来 得 看 寄存 右 、 内 存单 元 或 者 标志 寄存 需 的 内 容 ， 这 
条 指令 就 是 为 这 个 目的 而 设 的 。 

指令 都 是 连续 存放 的 ， 因 此 ， 所 谓 的 断 点 ， 束 是 某 条 指令 的 起 始 地 
址 。int3 是 单字 市 指 令 ， 这 是 有 意 设计 的 。 当 需要 设置 断 点 时 ， 可 以 将 
断 点 处 那 条 指令 的 第 1 字 节 改 成 0xcc， 原 字 节 予以 保存 。 当 处 理 器 执行 
到 int3 时 ， 即 发 生 3 号 中 断 ， 转 去 执行 相应 的 中 断 处 理 程序 。 中 上 断 处 理 程 
序 的 执行 也 要 用 到 各 个 寄存 器 ， 这 会 破坏 它们 的 内 容 ， 但 push 指令 不 
会 。 我 们 可 以 在 该 程序 内 先 压 栈 所 有 相关 寄存 器 和 内 存单 元 ， 然 后 分 别 
取出 予以 显示 ， 它 们 就 是 中 断 前 的 现场 内 容 。 最 后 ， 再 恢复 那 条 指令 的 
第 1 字 节 ， 并 修改 位 于 栈 中 的 返回 地 址 ， 执 行 iret 指令 。 

注意 ，int3 和 int 3 不 是 一 回 事 。 前 者 的 机 器 人 码 为 CC， 后 者 则 是 CD 
03， 这 就 是 通 销 所 说 的 int n， 其 操作 码 为 0xXCD， 第 2 字 节 的 操作 数 给 出 
了 中 断 号 。 举 几 个 例子 : 


int 0x00 :引发 0 号 中 断 
jint 0x15 :引发 0x15 号 中 断 
int 0x16 :引发 0x16 号 中 断 


into 是 溢出 中 断 指 令 ， 机 器 码 为 0xCE， 也 是 单字 节 指 令 。 当 处 理 器 
执行 这 条 指令 时 ， 如 末 标 志和 寄 和 存 占 的 OF 位 是 1， 那 么 ， 将 产生 4 号 中 
汤 。 耕 则 ， 这 条 指令 什么 也 不 做 。 


9.3.1 BIOS 中 断 


可 以 为 所 有 的 中 断交 型 目 定义 中 断 处 理 过 程 ， 包 括 内 部 中 断 、 便 件 
中 断 和 软 中 断 。 特 列 古 考虑 到 处 理 可 允许 256 种 中 汤 类 型 ， 而 且 大 部 分 
都 没有 被 硬件 和 处 理 器 内 部 中 断 占用 。 


编写 目 己 的 中 断 处 理 程序 有 相当 大 的 优越 之 处 。 不 像 imp 和 call 指 
令 ，int 指令 不 需要 知道 目标 程序 的 入 口 地 址 。 远 转移 指令 jmp 和 远 调 用 
指令 call 必须 直接 或 者 间接 给 出 目标 位 置 的 段 地 址 和 含 移 地 址 ， 如 果 所 有 
这 一 切 都 是 目 己 安排 的 ， 倒 也 不 成 问题 ， 但 如 果 想 调用 别人 的 代码 ， 比 
如 操作 系统 的 功能 ， 这 就 很 麻烦 了 。 举 个 例子 来 襄 ， 假 如 你 想 读 人 硬盘 上 
的 一 个 文件 ， 因 为 操作 系统 有 这 样 的 功能 ， 所 以 就 不 必 在 目 己 的 程序 中 
再 写 一 套 人 代码， 直接 调用 操作 系统 例 程 束 可 以 了 。 


但 是 ， 操 作 系 统 通 种 不 会 给 出 或 者 公 布 便 盘 读 与 例 程 的 段 地 址 和 侦 
移 地 址 ， 因 为 操作 系统 也 是 经 常 修 改 的 ， 经 津 友 布 新 的 版 本 。 这 样 一 
来 ， 例 程 的 入 口 地 址 也 会 跟着 变化 。 而 且 ， 也 不 能 保证 每 次 启动 计算 机 
之 后 ， 操 作 系 统 忌 行 在 同一 个 内 存 位 置 。 


因为 有 了 软 中 断 ， 这 是 个 利好 条 件 。 每 次 操作 系统 加 载 完 目 己 之 
后 ， 以 中 断 处 理 程序 的 形 陈 提供 人 硬盘 谈 与 功能 ， 并 把 该 例 程 的 地 址 填 与 
到 中 汤 问 量 表 中 。 这 样 ， 无 论 在 什么 时 候 ， 用 户 程 序 需 要 该 功能 时 ， 直 
接 友 出 一 个 软 中 断 即 可 ， 不 需要 知道 具体 的 地 址 。 

最 有 名 的 软 中 断 是 BIOS 中 断 ， 之 所 以 称 为 BIOS 中 断 ， 征 因为 这 些 
中 断 功能 是 在 计算 机 加 电 之 后 ，BIOS 程序 执行 期 间 建立 起 来 的 。 换 句 话 
说 ， 这 些 中 靳 功能 在 加 载 和 执行 主 引 叶 届 区 之 前 ， 束 已 经 可 以 使 用 了 。 

BIOS 中 断 ， 义 称 BIOS 蕊 能 调用 ， 主 要 是 为 了 方便 地 使 用 了 最 基本 的 
便 件 访问 功能 。 不 同 的 便 件 使 用 不 同 的 中 断 号 ， 比 如 ， 使 用 键盘 服务 


Tn 06 


通 音 ， 为 了 区 分 针对 同一 使 件 的 不 同 功能 ， 使 用 寄存 大 AH 来 指定 具 
体 的 功能 编写 。 举 例 来 说 ， 以 下 指令 用 于 从 键盘 读 取 一 个 控 键 : 


mov ah,O0x00 ; 从 键盘 读 字 符 
int 0x16 ;键盘 服务 。 返 回 时 ， 字 符 代 码 在 寄存 器 AL 中 


在 这 里 ， 当 寄存 器 AH 的 内 容 是 0x00 时 ， 执 行 int 0x16 后 ， 中 上 断 服 
务 例 程 会 监视 键盘 动作 。 当 它 返 回 时 ， 会 在 寄存 器 AL 中 存放 按键 的 
ASCII 码 。 


BIOS 中 断 很 多 ， 它 们 是 在 BIOS 执行 期 间 安 亡 的 ， 当 主 引 寻 程序 开 
始 执行 时 ， 就 可 以 在 程序 中 使 用 了 。 本 准备 给 出 一 张 BIOS 功能 调用 列 
表 ， 但 是 考虑 到 现在 网 络 扩 术 很 及 过 ， 上 上 网 很 方便 ， 六 家 可 以 目 行 从 互 
联网 上 寻找 相关 的 BIOS 功能 调用 资料 ， 然 后 在 目 己 的 程序 中 做 实验 。 

你 可 能 觉得 奇怪 ，BIOS 是 怎么 建立 起 这 套 功 能 调用 中 断 的 ? 它 又 是 
怎么 知道 如 何 访问 使 件 的 ? 毕竟 ， 即 使 是 它 ， 要 访问 硬件 也 得 通过 交口 
一 级 的 途径 。 


答案 是 ，BIOS 可 能 会 为 一 些 简 里 的 外 围 设备 提供 和 初始 化 代码 和 功能 
调用 代码， 并 填写 中 汤 问 量 表 ， 但 也 有 一 些 BIOS 中 断 是 由 外 部 设备 接口 
目 己 建立 的 。 


首先 ， 每 个 外 部 设备 接口 ， 包 括 各 种 板 卡 ， 如 网 卡 、 显 卡 、 键 租 接 
口 电路 、 硬 件 控制 器 等 ， 都 有 自己 的 只 读 存 储 右 (Read Only Memory， 
ROM ) ， 类 似 于 BIOS 芯片 ， 这 些 ROM 中 提供 了 它 自己 的 功能 调用 例 
程 ， 以 及 本 设备 的 初始 化 代 码 。 按 照 规 范 ， 前 两 个 单元 的 内 容 是 0x55 和 
0xAA， 第 三 个 单元 是 本 ROM 中 以 512 字 节 为 单位 的 代码 长 度 ， 从 第 四 
个 单元 开始 ， 束 是 实际 的 ROM 代码 。 

其 次 ， 我 们 知道 ， 从 内 存 物理 地 址 A0000 开始 ， 到 FFFFF 结束 ， 有 
相当 一 部 分 空间 是 留 给 外 围 设 备 的 。 如 果 设 备 存 在 ， 那 么 ， 它 自 带 的 
ROM 会 映射 到 分 配给 它 的 地 址 范围 内 。 


在 计算 机 局 动 期 间 ，BlIOS 程序 会 以 2KB 为 单位 搜索 内 存 地 址 C0000 
一 E0000 之 间 的 区 域 。 当 它 有 现 茶 个 区 域 的 头 两 个 字 节 是 0x55 和 0xAA 
时 ， 那 意味 看 该 区 域 有 ROM 代 人 码 存 在 ， 是 有 效 的 。 接 看 ， 它 对 壕 区 域 做 
累加 和 检查 ， 看 结果 是 任 第 三 个 单元 相 和 从。 如 果 相 和 人 符 ， 束 从 这 四 个 蛙 
元 进入 。 这 时 ， 处 理 硕 执行 的 是 使 件 目 市 的 程序 指令 ， 这 些 指令 初始 化 
外 部 设备 的 相关 寄存 融和 工作 状态 ， 节 后 ， 荐 与 相关 的 中 断 问 量 表 ， 使 
它们 指 同 目 市 的 中 断 处 理 过 程 。 


9.3.2 ”代码 清单 9-2 


本 章 有 配套 的 汇编 语言 源 程序 ， 并 围绕 这 些 源 程序 进行 讲解 ， 请 对 照 阅读 。 
本 章 代 码 清单 : 9-2“〈 被 加 载 的 用 户 程序 /BIOS 中 断 演 示 程 序 ) ， 源 程序 文件 : c09_ 2.asm 


9.3.3 ”从 键盘 读 字 符 并 显示 


代码 清单 9-2 在 框架 上 和 前 面 的 用 户 程 序 是 一 致 的 ， 差 别 在 于 代码 段 
的 功能 

代码 清单 9-2 第 28 一 32 行 用 于 初始 化 各 个 段 寄存 器 ， 这 和 以 前 的 做 
法 是 相同 的 。 

第 34 一 42 行 用 于 在 屏幕 上 显示 字符 串 ， 采 用 的 是 循环 的 方法 。 循 环 
用 的 是 loop 指令 ， 为 此 ， 第 34 行 用 于 计算 字符 串 的 长 上 度 ， 并 传送 到 寄存 
器 CX 中 ， 以 控制 循环 的 次 数 。 第 35 行 用 于 取得 字符 串 的 首 地 址 。 

向 屏幕 上 写字 符 使 用 的 是 BIOS 中 断 ， 有 具体 地 说 就 是 中 断 0x10 的 
0x0e 号 功能 ， 访 功能 用 于 在 屏幕 上 的 光标 位 置 处 写 一 个 字符 ， 并 推进 光 
标 位 置 。 第 38 一 40 行 分 别 按 规 范 的 要 求 准 备 各 个 参数 ， 执 行 软 中 断 。 

第 41、42 行将 递增 寄存 器 BX 中 的 偏 移 地 址 ， 以 指 疝 下 一 个 字符 在 
数据 段 中 的 位 置 。 然 后 ，loop 指令 将 寄存 器 CX 的 内 容 减 1， 并 在 其 不 为 
零 的 情况 下 返回 到 循环 体 开 始 处 ， 继 续 显 示 下 一 个 字符 。 

剩 下 的 工作 内 容 既 复杂 ， 又 简单 。 复 杂 是 指 ， 从 键盘 读 取 你 按 下 的 
那个 键 ， 并 把 它 显 示 在 屏幕 上 上， 很 复杂 ， 需 要 访问 硬件 ， 写 一 大 推 指 
令 。 人 简单 是 指 ， 因 为 有 了 BIOS 功能 调用 ， 这 只 需 儿 条 语句 就 能 完成 。 

第 45、46 行使 用 软 中 断 0x16 从 键盘 读 字 符 ， 需 要 在 寄存 器 AH 中 指 
定 0x00 号 功能 。 该 中断 返 回 后 ， 寄 存 器 AL 中 为 字符 的 ASCII 码 。 

第 48 一 50 行 又 一 次 使 用 了 int 0x10 的 0x0e 号 功能 ， 把 从 键盘 取得 的 
字符 显示 在 屏幕 上 。 

第 52 行 ， 执 行 一 个 无 条 件 转移 指令 ， 重 新 从 键盘 恋 取 新 的 字符 并 了 予 


9.3.4 ”代码 清单 9-2 的 编译 和 运行 


将 代码 清单 9-2 编辑 并 编译 后 ， 用 FixVhdWr 程序 将 生成 的 二 进 制 文 
件 写 入 虚拟 人 硬盘 ， 起 始 的 远 辑 局 区 写 同 样 为 100。 


如 图 9-6 所 示 ， 局 动 虚 拟 机 后 ， 会 看 到 一 段 欢迎 的 话 。 现 在 ， 你 可 以 
按 下 任何 按键 ， 它 们 将 原样 显示 在 >" 之 后 。 慢 慢 试 验 ， 细 细 体 会 ， 你 会 
发 现 某 些 按键 的 特点 。 比 如 ， 回 车 键 〈Enter ) 仅仅 是 将 光标 移 到 行 首 ， 
退 格 键 (Backspace) 仪 仪 古 将 光标 退 后 ， 并 不 破坏 该 位 置 上 的 字 侍 。 


LEARN-ASM [正在 运行 ] - Oracle VM VirtualBox = | 





Hello, friend? 

his simple procedure used to demonstrate the BIOS interrupt. 

lease press the keys on the keyboard ->hello,worldtfffffffffffeffefeeefeenefeenf 
fffffffffffffffffffffffffeffffffffffffasfsafsfsfasdfasfffa_ 











少 本 加 从 | 9 国 Right Ctrl 


图 9-6 ”代码 清单 9-2 编译 并 i 运行 后 的 效果 





本 章 习 题 


1. 修改 代码 9-1， 对 8259 心 帮 编程 ， 屏 菩 除 RTC 外 的 其 他 所 有 中 
浙 ， 观 察 字 人 符 “@” 的 变化 速度 。 

2. 修改 代码 9-1， 使 之 用 一 种 新 的 方法 来 产生 中 断 信 号 。 建 议 的 方 
法 是 采用 周期 性 中 断 。 不 过 ， 这 涉及 选择 分 频 电 路 的 分 节 上 点， 比如， 你 
可 以 选择 250ms 或 者 500ms， 它 们 分 别 会 在 1 秒 种 内 产生 4 次 或 2 次 中 
靳 。 


第 3 部 分 ”32 位 保护 模式 


学 习 处 理 嚣 32 位 保护 模式 的 工作 原理 ， 包 括 分 段 、 分 页 、 特 权 
级 、 保 护 、 中 断 和 异常 中 断 等 。 

学 习 32 位 保护 模式 下 的 汇编 语言 程序 设计 技术 。 

通过 多 个 实例 了 解 操 作 系 统 如 何在 保护 模式 下 加 载 应 用 程序 ， 并 
提供 各 种 管理 服务 。 

学 会 用 Bochs 虚 拟 机 调试 32 位 保护 模式 下 的 程序 。 


第 10 章 ”32 位 x86 处 理 器 编程 架构 


所 请 处 理 帮 架构 ， 或 者 处 理 帮 编程 染 构 ， 是 指 一 整套 的 便 件 结构 ， 
以 及 与 之 相 适 应 的 工作 状态 ， 这 其 中 的 灵魂 部 分 束 古 一 种 设计 理念 ， 决 
定 了 处 理 帮 的 应 用 环境 和 工作 模式 ， 也 决定 了 软件 开 友 人 员 如 何在 这 种 
模式 下 解决 实际 问题 。 染 构 内 的 资源 对 程序 员 来 说 是 可 见 的 、 可 访问 
的 ， 受 程序 的 控制 以 改变 处 理 帮 的 运行 状态 ; 非 染 构 的 资源 取决 于 具体 
的 便 件 实现 。 


处 理 需 架构 实际 上 是 不 断 扩 展 的 ， 新 处 理 噩 必须 延续 旧 的 设计 有 思 
路 ， 并 保持 兼容 性 和 一 致 性 ， 同 时 还 会 有 所 扩充 和 增强 。 

Intel 32 位 处 理 器 架构 简称 IA-32 (Intel Architecture，32-bit) ， 是 
以 1978 年 的 8086 处 理 需 为 基础 发 展 起 来 的 。 在 那个 时 候 ， 他 们 只 是 想 
造 一 蒜 特 别 牛 的 处 理 右 ， 也 没 考虑 到 架构 。 尺 管 那 些 人 是 专家 ,但 和 我 
们 一 样 不 是 千里 上 腿 ， 这 是 很 正常 的 。 

正如 我 们 已 经 知道 的 ，8086 有 20 根 地 址 线 ， 可 以 寻 址 1MB 内 存 。 
但 是 ， 它 内 部 的 寄存 器 是 16 位 的 ， 无 法 在 程序 中 访问 整个 1MB 内 存 。 上 所 
以 ， 它 也 是 第 一 款 支 持 内 存 分 段 模型 的 处 理 器 。 还 有 ，8086 处 理 器 只 有 
一 种 工作 模式 ， 即 实 模式 。 当 然 ， 在 那 时 ， 还 没有 实 模式 这 一 说 。 

由 于 8086 处 理 器 的 成 功 ， 推 动 着 Intel 公司 不 断 地 研发 更 新 的 处 理 
人 右 ，32 位 的 时 代 就 这 样 到 来 了 了 。 到 目前 为 止 ， 到 抵 有 多 少 种 类 型 ， 我 也 
说 不 清楚 。 尽 管 8086 是 16 位 的 处 理 器 ， 但 它 也 是 32 位 架构 内 的 一 部 
分 。 原 因 在 于 ，32 位 的 处 理 左 架构 是 从 8086 那里 及 展 来 的 ， 古 基于 
8086 的 ， 具 有 延续 性 和 羔 容 性 。 

就 我 们 曾经 用 过 的 产品 而 言 ，32 位 的 处 理 器 有 32 根 地 址 线 ， 数 据 线 
的 数量 是 32 根 或 者 64 根 。 特 别 是 最 近 最 新 的 处 理 右 ， 痢 是 64 根 。 
此 ， 它 可 以 访问 232， 即 4GB 的 内 存 ， 而 且 每 次 可 以 谈 与 连续 的 4 字 市 或 
者 8 字 节 ， 这 称 为 双 字 (Double Word) 或 者 4 字 (Quad Word) 访问 。 
当然 ， 如 果 你 要 按 字 节 或 者 字 来 访问 内 存 ， 也 是 允许 的 。 


我 总 说 ， 处 理 融 虽 小 ， 功 能 却 开 种 复 民 。 要 外 把 32 位 处 理 郝 的 所 有 
功能 部 解 释 清 起 ， 丰 是 一 件 简 时 的 事情 。 它 个 里 里 是 地 址 线 和 数据 线 的 


扩展 ， 实 际 上 还 有 更 多 的 部 分 ， 包 括 融 速 缓存 、 流 水 线 、 浮 点 处 理 部 
件 、 多 处 理 禹 《〈“ 核 ) 官 理 、 多 媒体 扩展 、 乱 序 执行 、 分 文 搞 调 、 虚 拟 
化 、 逻 度 和 电源 坨 理 等。 在 这 本 书 里 ， 我 的 一 个 基本 诛 则 是 ， 如 末 你 不 
能 讲 清楚 ， 干 脆 束 人 不要 所 它 。 因 此 ， 我 只 讲 那 些 现在 用 得 上 的 东西 。 


10.1 1IA-32 架构 的 基本 执行 环境 
10.1.1 寄存 器 的 扩展 


在 16 位 处 理 器 内 ， 有 8 个 通用 寄存 器 AX、BX、CX、DX、SI、DI、 
BP 和 SP， 其 中 ， 前 4 个 还 可 以 拆 分 成 两 个 独立 的 8 位 寄存 喜来 用 ， 即 
AH、AL、BH、BL、CH、CL、DH 和 DL。 如 图 10-1 所 示 ，32 位 处 理 器 
在 16 位 处 理 器 的 基础 上 ， 扩 展 了 这 8 个 通用 寄存 器 的 长 度 ， 使 之 达到 32 
位 。 
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者 ee ee | -一 一 
一 人 一 一 一 一 一 人 一 人 
引 15 7 0 3 ] 13 7 0 
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ed ed 
EBP ESP 
i EE 
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图 10-1 ”32 位 处 理 右 内 部 的 通用 寄存 此 


为 了 在 汇编 语言 程序 中 使 用 经 过 扩展 (Extend) 的 寄存 器 ， 需 要 给 
它们 命名 ， 它 们 的 名 字 分 别 是 EAX、EBX、ECX、EDX、ESI、EDI、 
ESP 和 EBP。 可 以 在 程序 中 使 用 这 些 寄存 器 ， 即 使 是 在 实 模式 下 : 


mov eax, Oxf0000005 
mOV ecx,eax 


add edx, ecx 


但 是 ， 就 像 以 上 指令 所 示 的 那样 ， 指 令 的 源 操作 数 和 目的 操作 数 必 
须 具 有 相同 的 长 度 ， 个 别 特殊 用 途 的 指令 除外 。 因 此 ， 像 这 样 的 搭配 是 
不 允许 的 ， 在 程序 编译 时 ， 编 译 器 会 报告 错误 ， 


ev ; 错误 的 汇编 语言 指令 


如 科目 的 操作 数 是 32 位 寄存 冲 ， 源 操作 数 是 立即 数 ， 那 么 ， 立 即 数 
航 视 为 32 位 的 : 


mo ax OUOXT5 本 一 有 0OD00080S5 


32 位 通用 寄 仔 吉 的 局 16 位 是 不 可 独立 使 用 的 ， 但 低 16 位 你 持 同 16 
位 处 理 右 的 阅 容 性 。 因 此 ， 在 任何 时 候 它 们 都 可 以 照 往 弟 一 样 使 用 : 


mov ah 0x02 
mov dl 0x03 


adqd ax,s1l 


可 以 在 32 位 处 理 占 上 运行 16 位 处 理 血 上 的 软件 。 但 是 ， 它 并 不 是 
16 位 处 理 器 的 简单 增强 。 事 实 上 ，32 位 处 理 器 有 自己 的 32 位 工作 模 
式 ， 在 本 书 中 ，32 位 模式 特 指 32 位 保护 模式 。 在 这 种 模式 下 ， 可 以 完 
爹 、 充 分 地 友 挥 处 理 故 的 性 能 。 同 时 ， 在 这 种 柑 式 下 ， 处 理 融 可 以 使 用 
它 全 部 的 32 根 地 址 线 ， 能 够 访问 4GB 内 存 。 


如 图 10-2 所 示 ， 在 32 位 模式 下 ， 为 了 生成 32 位 物理 地 址 ， 处 理 需 
需要 使 用 32 位 的 指令 指针 寄存 器 。 为 此 ，32 位 处 理 器 扩展 了 IP， 使 之 达 
到 32 位 ， 即 EIP。 当 它 工 作 在 16 位 模式 下 时 ， 依 然 使 用 16 位 的 IP; 工作 
在 32 位 模式 下 时 ， 使 用 的 是 全 部 的 32 位 EIP。 和 往常 一 样 ， 即 使 是 在 32 
位 模式 下 ，EIP 寄存 器 也 只 由 处 理 器 内 部 使 用 ， 程 序 中 是 无 法 直接 访问 


的 。 对 IP 和 EIP 的 修改 通常 是 用 某 些 指令 隐 式 进行 的 ， 这 些 指 令 包 括 
JMP、CALL、RET 和 |RET 等 等 。 


EIP EFLAGS 
31 15 0 31 15 0 
| 二 下 | FLAGS 


sm ses 


15 0 | 
绒 术 竺 商 加 级 有 尖 


描述 符 高 速 绥 存 吕 


描述 符 高 速 缓 存 器 
描述 符 遍 速 缓存 器 
描述 符 高 速 缓存 器 

图 10-2 ”32 位 处 理 器 的 指令 指针 、 标 志和 上段 宫 和 存 右 


另外 ， 在 16 位 处 理 嚣 中， 标志 寄存 堪 FLAGS 是 16 位 的 ， 在 32 位 处 
理 器 中 ， 扩 展 到 了 32 位 ， 低 16 位 和 原先 保持 一 致 。 关 于 EFLAGS 中 的 各 
个 标志 位 ， 将 在 后 面 的 章节 中 逐一 介绍 。 

在 32 位 模式 下 ， 对 内 存 的 访问 从 理论 上 来 说 不 再 需要 分 段 ， 因 为 它 
有 32 根 地 址 线 ， 可 以 目 由 访问 任何 一 个 内 存 位 置 。 但 是 ，IA-32 架构 的 
处 理 器 是 基于 分 段 模型 的 ， 因 此 ，32 位 处 理 器 依然 需要 以 段 为 单位 访问 
内 存 ， 即 使 它 工 作 在 32 位 模式 下 。 

不 过 ， 它 也 提供 了 一 种 变通 的 方案 ， 即 ， 只 分 一 个 段 ， 段 的 基地 址 
是 0xX00000000， 段 的 长 度 〈 大 小 ) 是 4GB。 在 这 种 情况 下 ， 可 以 视 为 不 
分 段 ， 即 平坦 模型 (Flat Mode) 。 


每 个 程序 都 有 属于 目 己 的 内 存 空间 。 在 16 位 模式 下 ， 一 个 程序 可 以 
目 由 地 访问 不 属于 它 的 内 存 位 置 ， 其 至 可 以 对 那些 地 方 的 内 容 进 行 修 
改 。 这 当然 是 不 安全 的 ， 也 不 合法 ， 但 部 没有 任何 机 制 来 限制 这 种 行 
为 。 在 32 位 模式 下 ， 处 理 占 要 求 在 加 载 程序 时 ， 先 定义 设 程 序 所 拥有 的 
段 ， 然 后 允许 使 用 这 些 段 。 定 义 段 时 ， 除 了 基地 址 《起 始 地 址 ) 外 ， 还 





附加 了 段 寞 限 、 特 权 级 别 、 关 型 等 属性 。 当 程序 访问 一 个 段 时 ， 处 理 需 
将 用 固件 实施 各 种 检查 工作 ， 以 防止 对 内 存 的 违规 访问 。 


如 图 10-2 所 示 ， 在 32 位 模式 下 ， 传 统 的 段 寄 人 存 益 ， 如 CS、SS、 
DS、ES， 保 存 的 不 再 是 16 位 段 基地 址 ， 而 是 段 的 选择 子 ， 即 ， 用 于 选择 
所 要 访问 的 段 ， 因 此 ， 严 格 地 说 ， 它 的 新 名 字 叫 做 段 选择 磺 。 除 了 段 选 
择 胡 之 外 ， 每 个 段 寄 人 存 耸 还 包括 一 个 不 可 见 部 分 ， 称 为 拷 述 符 局 速 缓存 
船 ， 里 面 有 段 的 基地 址 和 各 种 访问 属性 。 这 部 分 内 容 程序 不 可 访问 ， 由 
处 理 带 目 动 使 用 。 


有 天 32 位 模 陈 下 的 段 和 段 的 访问 方法 ， 将 在 后 面 的 章节 中 予以 评 
述 ， 你 在 看 这 段 文字 的 时 候 ， 也 许 有 迷 迷 糊糊 的 感觉， 没关系 ， 这 和 是正 
前 的 ， 到 后 面 你 就 会 感觉 罕 然 开明 了 了 。 

最 后 ，32 位 处 理 右 增加 了 两 个 籁 外 的 段 寄存 融 FS 和 GS。 对 于 未 些 
复 森 的 程序 来 说 ， 多 出 两 个 段 寄 和 存 剖 可 能 会 令 它 们 感到 融 兴 。 


10.1.2 基本 的 工作 模式 


8086 上 共有 16 位 的 段 寄 存 堪 、 指 令 指 针 寄 存 左 和 通用 寄存 希 〈CS、 
SS、DS、ES、IP、AX、BX、CX、DX、SI、DI、BP、SP) ， 因 此 ， 
我 们 称 它 为 16 位 的 处 理 器 。 尺 管 它 可 以 访问 1MB 的 内 存 ， 但 是 只 能 分 段 
进行 ， 而 且 由 于 只 能 使 用 16 位 的 段 内 偏 移 量 ， 故 7 段 的 长 上 度 最 大 只 能 是 
64KB。8086 只 有 一 种 工作 模式 ， 即 实 模 式 。 当 然 ， 这 个 名 称 是 后 来 才 
提出 来 的 。 

1982 年 的 时 候 ，lntel 公司 推出 了 80286 处 理 器 。 这 也 是 一 款 16 位 
的 处 理 器 ， 大 部 分 的 寄存 器 都 和 8086 处 理 器 一 样 。 因 此 ，80286 和 8086 
一 样 ， 因 为 段 寄 存 器 是 16 位 的 ， 而 且 只 能 使 用 16 位 的 偏 移 地 址 ， 在 实 模 
式 下 只 能 使 用 64KB 的 段 ， 尽 管 它 有 24 根 地 址 线 ， 理 论 上 可 以 访问 224， 
即 16MB 的 内 存 , 但 依然 只 能 分 成 多 个 段 来 进行 。 


但 是 ，80286 和 8086 不 一 样 的 地 方 在 于 ， 它 第 一 次 提出 了 保护 模式 
的 概念 。 在 保护 模式 下 ， 上 段 寄 存 右 中 保存 的 不 再 是 段 地 址 ， 而 是 段 选择 
子 ， 真 正 的 段 地 址 位 于 段 寄 存 右 的 接 述 符 高 速 缓存 中 ， 是 24 位 的 。 
此 ， 运 行 在 保护 模式 下 的 80286 处 理 器 可 以 访问 全 部 16MB 内 存 。 


80286 处 理 器 访问 内 存 时 ， 不 再 需要 将 段 地 址 左 移 ， 因 为 在 段 寄 存 
器 的 描述 符 高 速 缓存 器 中 有 24 位 的 段 物理 基地 址 。 这 样 一 来 ， 段 可 以 位 


于 16MB 内 存 空间 中 的 任何 位 置 ， 而 不 再 限于 低 端 1MB 范围 内 ， 也 不 必 
非得 是 位 于 16 字 节 对 齐 的 地 方 。 不 过 ， 由 于 80286 的 通用 寄存 器 是 16 位 
的 ， 只 能 提供 16 位 的 偏 移 地 址 ， 因 此 ， 和 8086 一 样 ， 即 使 是 运行 在 保 
护 模 式 下 ， 段 的 长 度 依然 不 能 超过 64KB。 对 段 长 度 的 限制 妨碍 了 80286 
处 理 圳 的 应 用 ， 这 葡 是 16 位 保护 模式 很 少 为 人 所 知 的 原因 。 


实 模式 等 同 于 8086 模式 ， 在 本 书 中 ， 实 模式 和 16 位 保护 模式 统称 
16 位 模式 。 在 16 位 模式 下 ， 数 据 的 大 小 是 8 位 或 者 16 位 的 ; 控制 转移 
和 内 存 访 问 时 ， 偏 移 量 也 是 16 位 的 。 


1985 年 的 80386 处 理 需 是 Intel 公司 的 第 一 于 32 位 产品 ， 而 且 获 得 
了 极 大 成 功 ， 是 后 续 所 有 32 位 产品 的 基础 。 本 书 中 的 绝 大 多 数 例 子 ， 都 
可 以 在 80386 上 运行 。 和 8086/80286 不 同 ，80386 处 理 器 的 寄存 器 是 32 
位 的 ， 而 且 拥 有 32 根 地 址 线 ， 可 以 访问 232， 即 4GB 的 内 存 。 


80386， 以 及 所 有 后 续 的 32 位 处 理 器 ， 都 兼容 实 模式 ， 可 以 运行 实 
模式 下 的 8086 程序 。 而 且 ， 在 刚 加 电 时 ， 这 些 处 理 器 都 自动 处 于 实 模式 
下 ， 此 时 ， 它 相当 于 一 个 非常 快速 的 8086 处 理 器 。 只 有 在 进行 一 番 设 置 
之 后 ， 才 能 运行 在 保护 模式 下 。 

在 保护 模式 下 ， 所 有 的 32 位 处 理 器 都 可 以 访问 多 达 4GB 的 内 存 ， 它 
们 可 以 工作 在 分 段 模型 下 ， 每 个 段 的 基地 址 是 32 位 的 ， 段 内 偏 移 量 也 是 
32 位 的 ， 因 此 ， 段 的 长 度 不 受 限 制 。 在 最 典型 的 情况 下 ， 可 以 将 整个 
4GB 内 存 定 义 成 一 个 段 来 处 理 ， 这 就 是 所 谓 的 平坦 模式 。 在 平坦 模式 
下 ， 可 以 执行 4GB 范围 内 的 控制 转移 ， 也 可 以 使 用 32 位 的 偏 移 量 访问 任 
何 4GB 范围 内 的 任何 位 置 。32 位 保护 模式 兼容 80286 的 16 位 保护 模 
Fe 


除了 保护 模式 ，32 位 处 理 絮 还 提供 虚拟 8086 模式 (V86 模式 ) ， 
在 这 种 模式 下 ，IA-32 处 理 器 被 模拟 成 多 个 8086 处 理 需 并 行 工 作 。V86 
模式 是 保护 模式 的 一 种 ， 可 以 在 保护 模式 下 执行 多 个 8086 程序 。 传 统 
上 ， 要 执行 8086 程序 ， 处 理 器 必须 工作 在 实 模式 下 。 在 这 种 情况 下 ， 为 
32 位 保护 模式 写 的 程序 就 不 能 运行 。 但 是 ，V86 模式 提供 了 让 它们 在 一 
起 同时 运行 的 条 件 。 

V86 模式 曾经 很 有 用 ， 因 为 在 那个 时 候 ，8086 程序 很 多 ， 而 32 位 
应 用 程序 很 少 ， 这 个 过 渡 期 是 必需 的 。 现 在 ， 这 种 工作 模式 已 经 基本 无 
了 和 


在 本 书 中 ，32 位 模式 特 指 IA-32 处 理 器 上 的 32 位 保护 模式 。 不 存在 
所 谓 的 32 位 实 模 式 ， 实 模式 的 概念 实质 上 束 古 8086 模式 。 


10.1.3 ”线性 地 址 


为 IA-32 处 理 器 编程 ， 访 问 内 存 时 ， 需 要 在 程序 中 给 出 段 地 址 和 偏 移 
量 ， 因 为 分 段 是 IA-32 架构 的 基本 特征 之 一 。 传 统 上 ， 段 地 址 和 偏 移 地 址 
称 为 逻辑 地 址 ， 偏 移 地 址 叫做 有 效 地 址 〈Effective Address，EA) ,在 
指令 中 给 出 有 效 地 址 的 方式 叫做 寻 址 方式 (Addressing Mode) 。 比 如 : 


inc word [bx+si+0x06] 


在 这 里 ， 指 令 中 使 用 的 是 基 址 加 变 址 的 方式 来 寻找 最终 的 操作 数 。 


段 的 管理 是 由 处 理 融 的 段 部 件 负责 进行 的 ， 段 部 件 将 段 地 址 和 俩 移 
地 址 相 加 ， 得 到 访问 内 存 的 地 址 。 一 般 来 说 ， 段 部 件 产 生 的 地 址 束 古 物 
理 地 址 。 


IA-32 处 理 器 支持 多 任务 。 在 多 任务 环境 下 ， 任 务 的 创建 需要 分 配 内 
存 空 间 ; 当 任 务 终止 后 ， 还 要 回收 它 所 占用 的 内 存 空间 。 在 分 段 模型 
下 ， 内 存 的 分 配 是 不 定 长 上 时， 程序 大 时 ， 束 分 配 一 大 块 内 存 ; 程序 小 
时 ， 吏 分 配 一 小 卖 。 时 间 长 了 ， 内 存 空间 孢 会 碎片 化 ， 残 有 可 能 出 现 一 
种 情况 : 内存 空间 是 有 的 ， 但 都 是 小 块 ， 无 法 分 配给 某 个 任务 。 为 了 解 
决 这 个 问题 ，|A-32 处 理 需 文 持 分 页 功能 ， 分 页 功能 将 物理 内 存 空 间 划分 
成 逻辑 上 的 页 。 页 的 大 小 是 固定 的 ， 一 般 为 4KB， 通 过 使 用 页 ， 可 以 简 
化 内 存 管理 。 

如 图 10-3 所 示 ， 当 页 功能 开启 时 ， 上 段 部 件 产 生 的 地 址 整 不 再 是 物理 
地 址 了 ， 而 是 线性 地 址 (Linear Address) ， 线 性 地 址 还 要 经 页 部 件 转换 
后 ， 才 是 物理 地 址 。 


EFFEEEFEE 


未 开 尼 页 功能 时 ， 线 性 地 址 就 是 物理 地 址 
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图 10-3 ”线性 地 址 和 线性 地 址 空间 


线性 地 址 的 概念 用 来 描述 任务 的 地 址 空间 。 如 图 10-3 所 示 ，IA-32 
处 理 絮 上 的 每 个 任务 都 拥有 4GB 的 虚拟 内 存 空 间 ， 这 是 一 段 长 4GB 的 平 
坦 空间 ， 就 像 一 段 平 直 的 线段 ， 因 此 叫 线性 地 址 空间 。 相 应 地 ， 由 段 音 
件 产生 的 地 址 ， 就 对 应 着 线性 地 址 空间 上 的 每 一 个 点 ， 这 就 是 线性 地 
址 。 


IA-32 架构 下 的 任务 、 分 段 、 分 页 等 内 容 ， 是 本 书 的 重点 ， 要 在 后 半 
部 分 详细 论述 。 


10.2 ”现代 处 理 器 的 结构 和 特点 


10.2.1 流水 线 


处 理 邢 的 每 一 次 更 新 换代 ， 者 会 增加 看 干 新 特性 ， 这 征 很 目 然 的 。 
同时 我 们 也 会 肥 现 ， 老 软件 在 新 的 处 理 堪 上 跑 得 更 快 。 这 里 面 的 原因 很 
简单， 处 理 硕 的 谈 计 者 总 是 在 想 尽 办 法 加 快 指令 的 执行 。 


早 在 8086 时 代 ， 处 理 器 就 已 经 有 了 指令 预 取 队列 。 当 指令 执行 时 ， 
如 果 总 线 是 空闲 的 〈 没 有 访问 内 存 的 操作 ) ， 束 可 以 在 指令 执行 的 同时 
预 取 指令 并 提前 译 码 ， 这 种 做 法 是 有 效 鸭 ， 能 大 大 加 快 程序 的 执行 速 
度 。 

处 理 器 可 以 做 很 多 事情 ， 换 言 之 ， 能 够 执行 各 种 不 同 的 指令 ， 完 成 
不 同 的 功能 ， 但 这 些 事情 大 都 不 会 在 一 个 时 钟 周期 内 完成 。 执 行 一 条 指 
令 雷 要 从 内 存 中 取 指 令 、 译 码 、 访 问 操 作 数 和 结果 ， 并 进行 移 位 、 加 
法 、 减 法 、 乘 法 以 及 其 他 任何 需要 的 操作 。 

为 了 提高 处 理 器 的 执行 效率 和 速度 ， 可 以 把 一 条 指令 的 执行 过 程 分 
解 成 知 干 个 细小 的 步骤 ， 并 分 配给 相应 的 单元 来 完成 。 各 个 单元 的 执行 
是 独 芯 的、 并行 的 。 如 此 一 来 ， 各 个 步骤 的 执行 在 时 间 上 残 会 重合 起 
来 ， 这 种 执行 指令 的 方法 就 是 流水 线 (Pipe-Line) 技术 。 

比如 ， 一 条 指令 的 执行 过 程 分 为 取 指 令 、 译 码 和 执行 三 个 步骤 ， 而 
且 假 定 每 个 步骤 都 要 花 1 个 时 钟 周 期 ， 那 么 ， 如 图 10-4 所 示 ， 如 果 采 用 顺 
序 执 行 ， 则 执行 三 条 指令 就 要 花 9 个 时 钟 周 期 ， 每 3 个 时 钟 周期 才能 得 到 
一 条 指令 的 执行 结果 ; 如 果 采 用 3 级 流水 线 ， 则 执行 这 三 条 指令 只 需 5 个 
时 钟 周期 ， 每 隔 一 个 时 钟 周期 就 能 得 到 一 条 指令 的 执行 结 
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图 10-4 流水 线 的 基本 原理 


一 个 简单 的 流水 线 其实 不 过 如 此 ， 但 是 ， 它 仍 有 很 大 的 改进 空间 。 
原因 很 简单 ， 指 令 的 执行 过 程 仍然 可 以 继续 细 人 分。 一般 来 说 ， 流 水 线 的 
效率 受 执行 时 间 最 长 的 那 一 级 的 限制 ， 要 缩短 各 级 的 执行 时 间 ， 就 必须 
让 每 一 级 的 任务 减少 ， 与 此 同时 ， 就 需要 把 一 些 复 林 的 任务 再 进行 分 
解 。 比 如 ，2000 年 之 后 推出 的 Pentium 4 处 理 器 采用 了 NetBurst 微 结 
构 ， 它 进一步 分 解 指令 的 执行 过 程 ， 采 用 了 31 级 超 深 流 水 线 。 


10.2.2 ”高 速 缓存 


影响 处 理 妖 速度 的 男 一 个 因素 是 存 信 如。 从 处 理 嚣 内 部 问 外 看 ， 它 
们 分 别 是 寄存 器 、 内 存 和 硬盘。 当然 ， 现 在 有 的 计算 机 已 经 用 上 了 固态 
人 厂 盘 。 


寄存 占有 的 速度 是 最 快 的 ， 原 因 在 于 它 使 用 了 触 肥 费 ， 这 是 一 种 利用 
反馈 原理 制作 的 存储 电路 ， 在 《 罕 越 计算 机 的 迷 筋 》 那 本 书 里 ， 介 绍 得 
很 清楚 。 触 发 器 的 工作 速度 是 纳 秒 (ns) 级 别 的 ， 当 然 也 可 以 用 来 作为 
内 存 的 基本 单元 ， 即 静态 存储 器 (SRAM ) ， 缺 点 是 成 本 太 高 ， 价 格 也 
不 菲 。 所 以 ， 制 作 内 存 必 片 的 材料 一 般 是 电容 和 单个 的 晶体 管 ， 由 于 电 
容 二 要 定时 刷新 ， 使 得 它 的 访问 速度 变 得 很 乙 ， 通 第 是 几 十 个 纳 秒 。 因 
此 ， 它 也 获得 了 一 个 恰当 的 名 字 : 动态 存储 右 (DRAM) ， 我 们 所 用 的 


内 存心 片 ， 大 部 分 部 是 DRAM。 最 后 ， 便 盘 是 机 电 设备 ， 是 机 械 和 电子 
的 混合 体 ， 它 的 速度 最 慢 ， 通 单 在 县 秒 级 (ms) 。 

在 这 种 情况 下 ， 因 为 需要 等 竺 内存 和 便 盘 这 样 的 悍 速 设备 ， 处 理 需 
便 无 法 全 速 运行 。 为 了 绥 解 这 一 邓 盾 ， 局 速 缓存 “(Cache) 技术 应 运 而 
咎 。 融 速 缓存 是 处 理 右 与 内 存 (DRAM) 之 间 的 一 个 静态 存储 人 如， 容量 
较 小 ， 但 速度 可 以 与 处 理 需 匹配 。 

高 速 绥 存 的 用 处 源 于 程序 在 运行 时 所 具有 的 局 部 性 规律 。 首 先 ， 程 
序 第 币 访 问 最 近 了 刚刚 访问 过 的 指令 和 数据 ， 或 者 与 它们 相 邻 的 指令 和 数 
据 。 比 如 ， 程 序 往往 是 序列 化 地 从 内 存 中 取 指 令 执 行 的 ， 循 环 操作 往往 
征 执行 一 段 固 定 的 指令 。 当 访问 数据 时 ， 要 访问 的 数据 通 第 都 被 安 排 在 
一 起 ; 其 人 次， 一旦 访问 了 未 个 数据 ， 那 么 ， 不 久之 后 ， 它 可 能 会 被 再 次 
访问 。 

利用 程序 运行 时 的 局 部 性 原理 ， 可 以 把 处 理 硕 正在 访问 和 即将 访问 
的 指令 和 数据 块 从 内 存 调 入 融 速 缓存 中 。 于 是 ， 每 当 人 处理 问 要 访问 内 存 
时 ， 首 先 检 索 局 速 缓存 。 如 末 要 访问 的 内 容 已 经 在 志 速 缓存 中 ， 那 么 ， 
很 好 ， 可 以 用 极 快 的 速度 御 接 从 高 速 缓存 中 取得 ， 这 称 为 命中 (Hit) ; 
人 宇 则 ， 称 为 不 中 (miss〉 。 在 不 中 的 情况 下 ， 处 理 器 在 取得 需要 的 内 容 
之 前 必须 重新 猴 载 遍 速 缓存 ， 而 不 只 是 直接 到 内 存 中 去 取 那 个 内 容 。 忆 
速 缓存 的 装载 是 以 块 为 单位 的 ， 包 括 那 个 所 需 数据 的 邻近 内 容 。 为 此 ， 
需要 额外 的 时 间 来 等 竺 块 从 内 存 载 入 高 速 缓存 ， 在 该 过 程 中 所 损失 的 时 
旧称 为 不 中 惩 宰 (miss penalty) 。 


局 速 缓 存 有 的 复 洒 性 在 于 ， 每 一 球 处 理 右 可 能 都 有 不 同 的 实现 。 在 一 
些 复 哥 的 处 理 右 内 部 ， 会 存在 多 级 Cache， 分 别 应 用 于 各 个 独立 的 执行 
部 件 。 


10.2.3 ” 乱 序 执行 


为 了 实现 流水 线 技术 ， 需 要 将 指令 拆 分 成 更 小 的 可 独立 执行 部 分 ， 
即 拆 分 成 微 操 作 〈microoperations) ， 人 简写 为 ops。 
有 些 指令 非常 简单 ， 因 此 只 需要 一 个 微 操 作 。 如 : 


add eax, ebx 


再 比如 : 


add eax, [menm | 


可 以 拆 分 成 两 个 微 操作 ， 一 个 用 于 从 内 存 中 读 取 数 据 并 保存 到 临时 寄存 
器 ， 另 一 个 用 于 将 EAX 寄存 器 和 临时 寄存 器 中 的 数值 相 加 


再 举 个 例子 ， 这 条 指令 : 
add [memj]j ,eaxX 


可 以 拆 分 成 三 个 微 操 作 ， 一 个 从 内 存 中 读数 据 ， 一 个 执行 相 加 的 动作 ， 
第 3 个 用 于 将 相 加 的 结果 写 回 到 内 存 中 。 

一 旦 将 指令 拆 分 成 微 操 作 ， 处 理 器 就 可 以 在 必要 的 时 候 乱 序 执行 
(Out-Of-Order Execution ) 程序 。 考 虑 以 下 例子 : 


mov eax, [meml| 
shl eax,S 
add eax, [mem2| 


mov [mem3],eax 


这 里 ， 指令 add eax,[mem2] 可 以 拆 分 为 两 个 和 做 操作 。 如 此 一 来 ， 在 
执行 逻辑 左 移 指 令 的 同时 ， 处 理 器 可 以 提前 从 内 存 中 读 取 mem2 的 内 
容 。 典 型 地 ， 如 果 数 据 不 在 高 速 缓存 中 〈 不 中 ) ， 那 么 处 理 器 在 获取 
mem1 的 内 容 之 后 ， 会 立即 开始 获取 mem2 的 内 容 ， 与 此 同时 ，shl 指令 
的 执行 早 束 开始 了 。 

将 指令 拆 分 成 微 操 作 ， 也 可 以 使 得 栈 的 操作 更 有 效率 。 考 虑 以 下 代 
但 片断 : 


push eax 


Gal rane 


这 里 ，push eax 指令 可 以 拆 分 成 两 个 和 做 操作 ， 即 可 以 表述 为 以 下 的 
等 价 形式 : 


sub esp,4 


mov [espl],eax 


这 就 带 来 了 一 个 好 处 ， 即 使 EAX 寄存 器 的 内 容 还 没有 准备 好 ， 微 操 
作 sub esp,4 也 可 以 执行 。call 指令 执行 时 需要 在 当前 栈 中 保存 返回 地 
址 ， 在 以 前 ， 该 操作 只 能 等 待 push eax 指令 执行 结束 ， 因 为 它 需 要 ESP 
的 新 值 。 感 谢 微 操 作 ， 现 在 ，call 指令 在 微 操作 sub esp,4 执行 结束 时 就 
可 以 无 延迟 地 立即 开始 执行 。 


10.2.4 寄存 器 重 命 名 
考虑 以 下 例子 : 


mov eax, [meml| 
shl a 3 
mov [mem2 |j ,eax 
mov eax, [mem3] 
add eaX 之 


mov [mem4j ,eaxX 


以 上 代码 片断 做 了 两 件 事 ， 但 互 不 相干 : 将 mem1 里 的 内 容 左 移 3 
次 〈 乘 以 8) ， 并 将 mem3 里 的 内 容 加 2。 如 果 我 们 为 最 后 三 条 指令 使 用 
人 不同 的 寄存 上 荔 ， 那 么 将 更 明显 地 看 出 这 两 件 事 的 无 和 天性 。 并 且 ， 事 实 
上 上 ， 处 理 右 实际 上 也 是 这 样 做 的 。 处 理 器 为 最 后 三 条 指令 使 用 了 为 一 个 
不 同 的 临时 寄存 葵 ， 因 此 ， 顽 移 〈 乘 法 ) 和 加 法 可 以 并 行 地 处 理 。 


IA-32 架构 的 处 理 器 只 有 8 个 32 位 通用 寄存 器 ， 但 通常 都 会 被 我 们 
全 部 派 上 用 场 〈 甚 至 还 觉得 不 够 ) 。 因 此 ， 我 们 不 能 奢望 在 每 个 计算 当 
中 都 使 用 新 的 寄存 器 。 不 过 ， 在 处 理 器 内 部 ， 却 有 大 量 的 临时 寄存 器 可 
用 ， 处 理 絮 可 以 重 命 名 这 些 寄存 右 以 代表 一 个 逻辑 寄存 右 ， 比 如 EAX。 

寄存 器 重 命 名 以 一 种 完全 自动 和 非常 简单 的 方式 工作 。 每 当 指 令 写 
逻辑 寄存 器 时 ， 处 理 右 就 为 那个 逻辑 寄存 右 分 配 一 个 新 的 临时 寄存 右 。 


mov eax, [meml] 
mov ebx, [mem2| 
add ebx,eax 
shl ea, 3 

mov [mem3] ,eax 


mov [Imem4j ,epx 


假定 现在 mem1 的 内 容 在 高 速 缓存 里 ， 可 以 立即 取得 ， 但 memz2 的 
内 容 不 在 高 速 绥 存 中 。 这 意味 着 ， 左 移 操 作 可 以 在 加 法 之 前 开始 《使 用 
临时 寄存 需 代 符 EAX) 。 为 左 移 的 结果 使 用 一 个 新 的 临时 寄存 器 ， 其 好 
处 是 EAX 寄存 硕 中 仍然 是 以 前 的 内 容 ， 它 将 一 直 保 持 这 个 值 ， 直 到 EBX 
寄存 硕 中 的 内 容 吏 绪 ， 然 后 同 它 一 起 做 加 法 和 运算。 如 各 没有 寄存 需 重 命 
名 机 制 ， 左 移 操作 将 不 得 不 等 每 从 内 存 中 读 取 mem2 的 内 容 到 EBX 寄存 
器 以 及 加 法 操作 完成 。 

在 所 有 的 操作 都 完成 之 后 ， 那 个 代表 EAX 寄存 器 最 终结 果 的 临时 寄 
存 器 的 内 容 被 写 入 真实 的 EAX 寄存 需 ， 访 处理 过 程 称 为 引退 
(Retirement) 。 


所 有 通用 寄存 器 ， 栈 指针 、 标 志 、 浮 点 寄存 器 ， 甚 至 段 守 存 器 都 有 
可 能 被 重 命名 。 


10.2.5 “分 文 目 标 预测 


流水 线 并 不 是 和 白 分 之 白 完 美的 解决 方 条。 实际 上 ， 有 很 多 潜在 的 因 
素 会 使 得 流水 线 不 能 达到 最 佳 的 效率 。 一 个 典型 的 情况 是 ， 如 末 直 到 一 
条 转移 指令 ， 则 后 面 那些 已 经 进入 流水 线 的 指令 丈 痢 无 效 了 。 换 人 句 话 
次， 我 们 必须 清空 《Flush) 流水 线 ， 从 了 要 转移 到 的 目标 位 置 处 重新 取 指 
令 放 入 流水 线 。 

在 现代 处 理 硕 中 ， 流 水 线 操 作 分 为 很 多 步 又 ， 包 括 取 指令 、 详 码 、 
寄存 右 分 配 和 重 命 名 、 微 操作 排序 、 执 行 和 引退 。 指 令 的 流水 线 处 理 方 
式 允 许 处 理 占 同时 做 很 多 事情 。 在 一 条 指令 执行 时 ， 下 一 条 指令 正在 获 
取 和 译 码 。 

流水 线 的 最 大 问题 是 代码 中 经 党 存在 分 文 。 举 个 例子 来 说 ， 一 个 条 
件 转移 允许 指令 法 前 往 任意 两 个 方 辐 。 如 果 这 里 只 有 一 个 流水 线 ， 那 
么 ， 直 到 那个 分 文 开 始 执行 ， 在 此 之 前 ， 处 理 堪 将 不 知道 应 该 用 哪个 分 
文 惠 充 流 水 线 。 流 水 线 越 长 ， 处 理 右 在 用 错误 的 分 文 填 充 沉 水 线 时 ， 浪 
如 的 时 间 越 多 。 

随 看 复杂 以 构 下 的 汽水 线 变 得 越 来 越 长 ， 程 序 分 文 市 来 的 问题 开始 
变 得 很 大 。 让 处 理 桌 的 设计 者 不 能 接受 ， 毕 葛 不 中 处 广 的 代价 越 来 越 


mm | 
oO 


[本 


为 了 解决 这 个 问题 ， 在 1996 年 的 Pentium Pro 处 理 嚣 上， 引入 了 分 
支 预测 技术 (Branch Prediction ) 。 分 支 预 测 的 核心 问题 是 ， 转 移 是 发 
生还 是 不 会 发 生 。 换 名 话说， 条 件 转 移 指令 的 条 件 会 不 会 成 也。 举 个 例 
子 来 说 : 


jne branch5 


在 这 条 指令 还 没有 执行 的 时 候 ， 处 理 喜 瓯 必 须 提 前 预测 相等 的 条 件 
在 这 条 指令 执行 的 时 候 是 否 成 立 。 这 当然 是 很 困难 的 ， 几 平 不 可 能 。 想 
起 看 ， 如 条 能 够 提前 知 关 结束， 还 执行 这 些 指令 干 嘛 。 

但 是 ， 从 统计 学 的 角度 来 看 ， 有 些 事情 一 旦 出 现 ， 下 一 次 还 会 出 现 
的 概率 较 大 。 一 个 典型 的 例子 束 是 人 循环， 比如 下 面 的 程序 片断 : 


en SLi,20 


nz Lops 


当 jnz 指令 第 一 次 执行 时 ， 转 移 一 定 会 有 友 生 。 那 么 ， 处 理 颖 束 可 以 预 
测 ， 下 一 次 它 还 会 转移 到 标号 lops 处 ， 而 不 是 顺序 往 下 执行 。 事 实 上 ， 
这 个 预测 通常 是 很 准 的 。 

在 处 理 占 内 部 ， 有 一 个 小 容量 的 高 速 缓存 器 ， 叫 分 文 目 标 绥 存 器 
(Branch Target Buffer，BTB) 。 当 处 理 器 执行 了 一 条 分 文 语句 后 ， 它 
会 在 BTB 中 记录 当前 指令 的 地 址 、 分 文 目标 的 地 址 ， 以 及 本 次 分 文 预 测 
的 结果 。 下 一 次 ， 在 那 条 转移 指令 实际 执行 前 ， 处 理 右 会 但 找 BTB， 看 
有 没有 最 近 的 转移 记录 。 如 果 能 找到 对 应 的 条 目 ， 则 推测 执行 和 上 一 次 
相同 的 分 文 ， 把 该 分 文 的 指令 送 入 流水 线 。 

当 访 指令 实际 执行 时 ， 如 条 预 测 是 失败 的 ， 那 么 ， 清 空 流 水 线 ， 同 
时 刷新 BTB 中 的 记录 。 这 个 代价 较 大 。 


10.3 32 位 模式 的 指令 系统 


10.3.1 32 位 处 理 器 的 寻 址 方式 


在 16 位 处 理 絮 上， 指令 中 的 操作 数 可 以 是 8 位 或 者 16 位 的 寄存 器 
指 问 8 位 或 者 16 Ce 位 内 存 地 址 ， 以 及 8 位 或 16 位 的 立即 
数 。 


如 果 指 令 中 包含 了 内 存 地 址 操作 数 ， 那 么 ， 它 必然 是 一 个 16 位 的 段 
内 偏 移 地 址 ， 称 为 有 效 地 址 。 通 过 有 效 地 址 ， 可 以 间接 取得 8 位 或 者 16 
位 的 实际 操作 数 。 指 定 有 效 地 址 可 以 使 用 基 址 寄存 大 BX、BP， 变 址 ( 索 
引 ) 寄存 器 SI 和 Dl， 同时 还 可 以 加 上 一 个 8 位 或 16 位 的 偏 移 量 。 比 如 : 


mo ax. LS 
mow a [Sxtd1il 


mov al,; [bxt+tsi+0x02 | 


以 上 ， 第 1 条 指令 ， 寄 存 器 BX 中 的 内 容 是 指 问 16 位 实际 操作 数 的 
16 位 地 址 ， 第 条 指令 ， eid BX 和 DI 的 内 容 相 加 ， 形 成 指向 16 位 实 
站 条 指令 ， 寄 存 器 BX、SlI 和 8 位 偏 移 量 共同 形 


成 指 问 8 位 实际 操作 数 的 1 1 位 地 址 。 


如 图 10-5 所 示 ， 这 是 16 位 处 理 器 的 内 存 寻 址 方式 示意 图 。 从 图 中 可 
以 看 出 ， 人 允许 使 用 基 址 寄存 器 BX 或 者 BP， 同 变 址 寄存 器 SI 或 者 DI 结 
合 ， 再 加 上 8 位 或 者 16 位 偏 移 量 来 寻 址 内 存 操作 数 。 


加 网罗 大 


图 10-5 ”16 位 处 理 器 的 内 存 寻 址 方式 


16 位 处 理 需 的 寻 址 方式 本 来 就 很 复杂 ， 当 32 位 处 理 需 出 现 后 ， 寄 存 
器 和 偏 移 地 址 的 宽度 都 扩展 了 ， 相应 地 ， 要 继续 扩展 原 有 的 寻 址 方式 。 
但 是 ， 原 有 的 16 位 方案 已 经 成 型 ， 再 进行 修补 是 非常 困难 的 。 一 个 可 行 


的 解决 方案 是 ， 让 16 位 指令 和 32 位 指令 共用 相同 的 指令 人 码 ， 但 通过 不 同 
的 指令 前 经， 结合 处 理 占 当前 的 运行 状态 来 决定 该 指令 有 的 寻 址 方式 。 

比如 ， 当 处 理 器 运行 在 16 位 模式 时 ， 如 果 没 有 指令 前 级 0x66， 则 认 
为 指令 是 传统 的 16 位 寻 址 方式 ; 右 有 指令 前 级 0x66， 则 指令 是 新 的 32 
位 寻 址 方式 。 如 果 处 理 右 当前 运行 在 32 位 模式 下 且 没 有 指令 前 缀 0Xx66， 
则 视 为 默认 的 32 位 寻 址 方式 ， 人 奋 则 就 是 传统 的 16 位 寻 址 方式 。 

32 位 处 理 天 兼容 16 位 处 理 右 的 工作 模式 ， 可 以 运行 传统 的 16 位 代 
僻 。 但 是 ， 它 有 目 己 独立 的 32 位 运行 模式 ， 而 且 只 有 在 这 种 模式 下 才能 
及 挥 最 局 的 运行 效率 。 

在 32 位 模式 下 ， 默 认 使 用 32 位 轩 度 的 寄存 右 。 如 : 

moVv eax, ebx 
如 果 指 令 中 使 用 了 立即 数 ， 那 么 ， 该 数值 默认 是 32 位 的 : 


mov eCXx, 0X35 ECX=*=0x00000055 


还 有 ， 如 条 指令 中 的 操作 数 是 指 网 内 存单 元 的 地 址 ， 那 么 ， 访 地址 
默认 是 32 位 的 段 内 偏 移 地 址 ， 或 者 叫 段 内 偏 移 量 : 


mov edx, [mem] ;mem 是 一 个 32 位 的 段 内 仿 移 地 址 


这 联 是 次， 如 此 指 令 中 包含 了 内 存 地 址 操作 数 ， 那 么 ， 生 必然 默认 
地 是 一 个 32 位 的 有 效 地 址 。 通 过 有 效 地 址 ， 可 以 间接 取得 32 位 的 实际 操 
作 数 。 如 图 10-6 所 示 ， 指 定 有 效 地 址 可 以 使 用 全 部 的 32 位 通用 寄存 器 作 
为 基 址 寄存 禹 。 同 时 ， 还 可 以 再 加 上 一 个 际 ESP 之 外 的 32 位 通用 宕 和 存 占 
作为 变 址 寄存 器 。 变 址 寄存 帮 还 允许 缮 以 1、2、4 或 者 8 作为 比例 因子 。 
最 后 ， 还 允许 加 上 一 个 8 位 或 者 32 位 的 偏 移 量 ，。 


EAX 


er EAX 1 
EBX 

ECX 

ns CE 

FSp 十 ED 和 xX 十 8 位 或 32 位 偏 移 量 
EBP 4 

EBP 
ESI 

El EDI 8 

EDI 


图 10-6 ”32 位 处 理 絮 的 内 存 寻 址 方式 


以 下 是 几 个 例子 : 


add eax, [0x2008] ; 有效 地 址 为 0x00002008 
sub eax, [eax+0x08] ; 有效 地 址 是 32 位 的 
mov ecx, [eaxt+ebx*8+0x02] ; 有效 地 址 是 32 位 的 


值得 说 明 的 是 ， 在 16 位 模式 下 ， 内 存 寻 址 方式 的 操作 数 不 允许 使 用 
栈 指 针 寄 人 存 右 SP。 因 此 ， 象 这 条 指令 就 是 不 正确 的 : 


mov ax, [spj 


但 是 ， 在 32 位 模式 下 ， 人 允许 在 内 存 操 作 数 中 使 用 栈 指 针 寄 存 右 
ESP。 因 此 ， 下 面 的 指令 形式 是 合法 的 : 


mov eax, [esp | 


10.3.2 操作 数 大 小 的 指令 前 级 


Intel 处 理 需 的 指令 系统 比较 复杂 ， 这 种 复杂 性 来 源 于 两 个 方面 ， 一 
是 指令 的 数量 较 多 ， 二 是 寻 址 方式 也 很 多 。 可 以 想象 ， 为 了 组 成 这 些 众 
多 的 指令 ， 必 须 有 一 侠 同 样 复 林 的 指令 格式 。 

如 图 10-7 所 示 ， 每 一 条 处 理 噩 指令 都 可 以 拥有 前 级， 比如 重复 前 绥 
(REP/REPE/ REPNE ) 、 段 超越 前 级 〈 如 ES: ) 、 总 线 封 锁 前 绥 
(LOCK) 等 。 前 缀 是 可 选 的 ， 每 个 前 缀 的 长 上 度 是 1 字 和 有 有， 每 条 指令 可 以 
有 1 一 4 个 前 经， 或 者 不 使 用 前 级 。 


前 级 (如 果 有 的 话 〉 的 后 面 是 操作 码 部 分 ， 指 示 执 行 什么 样 的 操 
作 ， 比 如 传送 、 加 法 、 减 法 、 乘 法 、 除 法 、 移 位 等 。 根 据 指令 的 不 同 ， 
操作 码 的 长 度 是 1~3 字 节 。 同 时 ， 操 作 码 还 可 以 用 来 指示 操作 的 字 长 ， 
即 数据 宽度 为 字 节 还 是 字 。 

操作 码 之 后 是 操作 数 类 型 和 寻 址 方式 部 分 。 这 部 分 是 可 选 的 ， 简 间 
的 指令 不 包含 这 一 部 分 ， 稍 微 复杂 一 点 的 指令 ， 这 一 部 分 只 有 1 字 节 ， 最 
复杂 的 指令 ， 可 能 有 2 字 节 。 这 部 分 给 出 了 指令 的 寻 址 方式 ， 以 及 寄存 器 
的 类 型 《用 的 是 哪个 寄存 器 )。 

指令 的 最 后 是 立即 数 和 偏 移 量 。 如 果 指令 中 使 用 了 立即 数 ， 那 么 立 
即 数 就 在 这 一 部 分 给 出 ， 如 果 指令 使 用 了 带 偏 移 量 的 寻 址 方式 ， 如 ; 





mov ex LOx2000| 


mov ecx, [eax+ebx*8+0x02] 


那么 ， 偏 移 量 0x2000 和 0x02 也 在 这 部 分 出 现 。 取 决 于 具体 的 指令 ， 
即 数 可 以 是 1、2 或 者 4 字 节 ， 偏 移 量 部 分 与 此 相同 。 


图 10-7” 1A-32 的 指令 格式 


上 述 的 指令 编码 格式 发 源 于 16 位 处 理 占 时 代 ， 并 在 32 位 处 理 问 出 现 
之 后 做 了 了 修改， 主要 是 扩展 了 数据 的 客 度 ， 其 他 部 你 持 不 变 。 毕 葛 ， 羔 
容 性 是 首要 考 碟 的 因 系 。 但 是 ， 这 也 市 来 了 一 些 问题 。 和 考虑 以 下 指令 : 


new lx, | bx+sit0Z02| 


在 16 位 指令 编码 格式 中 ， 这 种 内 存 早 元 到 寄存 占有 的 传 运 指令 使 用 了 
操作 人 码 0x8B。 如 图 10-8 (a) 所 示 ， 在 操作 人 码 0x8B 之 后 是 1 字 节 的 寻 址 
方式 和 操作 数 类 型 部 分 。 位 7 和 位 6 的 值 是 01， 表 示 使 用 了 基地 址 变 址 的 
寻 址 方式 ， 而 且 带 有 8 位 信 移 量 ; 位 5 一 位 3 的 值 是 010， 指 示 目 的 操作 
数 为 寄存 器 DX;， 位 2 一 位 0 的 值 是 000， 表 示 寻 址 方式 为 ‘BX+SI+8 位 偏 
移 量 ”"。 在 该 字 节 之 后 ， 是 1 字 节 的 偏 移 量 0x02。 因 此 ， 这 条 指令 编译 后 
的 机 絮 代 人 码 是 


8B 50 02 


32 位 处 理 右 使 用 相同 的 编码 格式 ， 但 是 ， 寻 址 方式 和 窜 存 右 的 定义 
却 是 另起炉灶 的 ， 完 全 不 同 于 16 位 指令 。 如 图 10-8 (b〉 所 示 ， 在 32 位 
处 理 需 上 上， 位 7 和 位 6 的 值 是 01， 表 示 使 用 了 基 址 寻 址 方式 ， 而 且 带 有 8 
位 偏 移 量 ;位 5 一 位 3 的 值 是 010， 指 示 目 的 操作 数 为 寄存 器 EDX; 位 2 一 
位 0 的 值 是 000， 表 示 寻 址 方式 为 EAX+8 位 偏 移 量 。 在 该 字 节 之 后 ， 是 1 
字 厄 的 偏 移 量 0x02。 因 此 ， 同 样 的 机 右 指 令 码 ， 却 对 应 看 不 同 的 32 位 指 


mov edx, [eax+0x02| 


这 就 是 说 ， 相 同 的 机 器 指令 ， 在 16 位 模式 下 和 32 位 模式 下 的 解释 和 
执行 效果 是 不 同 的 。 但 是 ， 别 忘 了 ，32 位 处 理 器 可 以 执行 16 位 的 程序 ， 
包括 实 模 式 和 16 位 保护 模式 。 为 此 ， 在 16 位 模式 下 ， 处 理 器 把 所 有 指令 
都 看 成 是 16 位 的 。 举 个 例子 ， 机 右 指 令 人 码 0x40 在 16 位 模式 下 的 合 义 是 


Te 


当 处 理 套 在 16 位 模式 下 运行 时 ， 也 可 以 使 用 32 位 的 寄存 器， 执行 
32 位 的 运算 。 为 此 ， 儿 须 便 用 指令 前 缀 0x66 来 师 时 改变 这 种 火 认 状态 ， 
因为 同一 个 指令 人 码 ， 在 16 位 模式 下 和 32 位 模式 下 具有 不 同 的 解释 。 
此 ， 当 处 理 占 在 16 位 模式 下 运行 时 ， 机 右 指 令 公 


66 40 
对 应 的 指令 不 再 是 inc ax， 而 是 
inc eax 


相反 地 ， 如 末 处 理 占 运行 在 32 位 模式 下 ， 那 么 ， 处 理 邢 认为 指令 的 
操作 数 都 是 32 位 的 ， 如 条 你 加 了 前 缀 ， 这 个 前 绥 殴 用 来 指示 指令 是 16 位 
的 。 因 此 ， 指 令 前 级 0x66 具有 反 转 当前 默认 操作 数 大 小 的 作用 。 


8 位 偏 移 量 BX 十 SI 十 偏 移 量 8 位 偏 移 量 EAX 十 偏 移 量 
| 
DX 寄 存 器 EDX 寄 存 器 
(a) 16 位 指令 (b) 32 位 指令 





图 10-8 16 位 指令 和 32 位 指令 的 寻 址 方式 和 操作 数 类 型 编码 对 比 


在 编 与 程序 的 时 候 ， 吏 应 当 考 碟 到 指令 的 运行 环境 。 为 了 指明 程序 
的 默认 运行 环境 ， 编 详 带 提供 了 伪 指 令 bits， 用 于 指明 其 后 的 指令 应 该 祝 
编译 成 16 位 的 ， 还 是 32 位 的 。 比 如 : 


CTES 9 


mo Cx UX > 9 Dl 
mOV eax,ebx “66 89 D8 
be 32 

mOY CA 766 89 D1 
mOV eax, ebx ”69 D8 


注意 ，bits 16 或 者 bits 32 可 以 放 在 方 括号 中 ， 也 可 以 没有 方 括 号 。 
以 下 两 种 方式 都 是 允许 的 : 


[电工 ES 2 


mOV ecx,edx 


bits 16 


IOV a%, 5 


最 后 ，16 位 模式 是 默认 的 编译 模 式 。 如 果 没 有 指定 指令 的 编译 模 
式 ， 则 默认 是 “bits 16” 的 。 

有 关 寻 址 方式 和 指令 前 级 的 话题 比较 复杂 ， 在 后 面 的 章节 里 ， 我 们 
将 在 适当 的 时 候 ， 结 合 程 序 和 具体 的 指令 进行 讲解 。 


10.3.3 一 般 指 令 的 扩展 


由 于 32 位 的 处 理 右 痢 拥 有 32 位 的 寄存 融和 和 质 术 远 辑 部 件 ， 而 且 同 内 
存心 片 之 间 的 数据 通路 至 少 是 32 位 的 ， 因 此 ， 所 有 以 寄存 伦 或 者 内 存单 
元 为 操作 数 的 指令 都 被 扩 序 ， 以 适应 32 位 的 算术 逻辑 操作 。 而 且 ， 这 些 
扩展 的 操作 即使 是 在 16 位 模式 下 《〈 实 模式 和 16 位 保护 模式 ) 也 是 可 用 
的 。 比 如 加 法 指令 ADD， 在 32 位 处 理 器 上 ， 除 了 人 允许 8 位 或 者 16 位 的 操 
作 数 外 ，32 位 的 操作 数 现 在 也 十 可 用 的 : 


adq 人 L151 
add ax,bx 


add eax, ebx 


add dword [ecx|], 0x0000005f 


除了 双 操 作 数 指令 ， 早 操作 数 指令 也 同样 允许 32 位 操作 数 。 比 如 : 


iNG 1 
1n@ dWOEd [0X2000|] 


dec dword [eax*2| 


我 们 已 经 接触 过 的 好 辑 移动 指令 ， 如 shl、shr 等 ， 目 的 操作 数 也 扩 
展 至 32 位 ， 但 用 于 指定 移动 次 数 的 源 操 作 数 足够 应 付 32 位 的 环境 ， 没 有 
变化 。 举 例 : 


4 
shl eax,9 


shl dweord ea 二 ”TU EL 


和 16 位 时 代 一 样 ， 在 32 位 处 理 苍 上 ， 池 和 辑 移动 指令 的 源 操作 数 如 末 
是 寄存 器 的 话 ， 则 依然 必须 使 用 CL。 同 时 ，32 位 处 理 器 在 实际 执行 时 ， 
要 先 将 源 操作 数 〈 在 CL 寄存 可 内 ) 同 0x1F 做 效 辑 与 。 也 束 古 说 ， 仪 你 
留 产 操作 数 的 低 5 位 ， 因 此 ， 实 际 移动 的 钦 数 最 大 为 31。 


在 16 位 处 理 器 上 ，loop 指令 的 循环 次 数 在 寄存 器 CX 中 。 在 32 位 处 
理 器 上 ， 如 果 当 前 的 运行 模式 是 16 位 的 (bits 16，8086 实 模 式 或 者 16 
位 保护 模式 ) ， 那 么 ，loop 指令 执行 时 ， 依 然 使 用 CX 寄存 器 ; 否则， 如 
果 运 行 在 32 位 模式 下 (bits 32) ， 则 使 用 的 是 ECX 寄存 器 。 


在 16 位 处 理 套 上 ， 无 符 亏 数 乘法 指令 mul 的 格式 为 


mul r/m8 :AX < ALXr/m8 
mul r/ml16 “DX AX = AXX rrAmIS 


在 32 位 处 理 融 上 ， 际 了 依然 文 持 上 述 操作 外 ， 还 支持 以 下 扩展 的 格 
式 : 


mul r/m32 :RDX*EAX < RAXX rr /m232 
这 样 ， 两 个 32 位 的 数 相 乘 ， 得 到 一 个 64 位 的 结果 。 这 里 有 个 例子 : 


moOV eax, Oxl10000 
mov ebx, 0x20000 


mu ebx 


有 符 扎 数 乘法 指令 imul 与 此 相同 。 
相应 地 ， 无 从 写 数 和 有 和 从 写 数 除法 也 做 了 32 位 扩展 : 


dliy AMS2 
LT P32 


在 这 里 ， 被 除数 是 64 位 的 ， 高 32 位 在 EDX 寄存 器 ; 低 32 位 在 EAX 
寄存 器 。 除 数 是 32 位 的 ， 位 于 32 位 的 寄存 器 ， 或 者 存放 有 32 位 实际 操 
作 数 的 内 存 地 址 。 指 令 执 行 后 ，32 位 的 商 在 EAX 寄存 器 ，32 位 的 余数 
在 EDX 寄存 器 。 

32 位 处 理 器 的 栈 操作 指令 push 和 pop 也 有 所 扩展 ， 人 允许 压 入 双 字 操 
作 数 。 特 别 是 ， 它 现在 支持 立即 数 压 栈 操作 。 立 即 数 压 栈 操作 的 指令 格 


push imm8 ;操作 人 码 为 6A 
push imml6 ; 操作 码 为 68 
push imm32 ; 操作 码 为 68 


举 个 例子 可 能 更 清楚 一 些 。 比 如 : 
push byte Ox55 


在 这 里 ， 关 键 字 “byte" 仅 仅 是 给 编译 器 用 的 ， 告 诉 它 ， 压 入 的 是 字 节 
(毕竟 立即 数 0x55 可 以 解释 为 字 0x0055 或 者 双 字 0x00000055) ， 而 不 
是 用 来 在 编译 后 的 机 器 指令 前 添加 指令 前 绥 。 

这 条 指令 的 16 位 形式 (用 bits 16 编译 ) 和 32 位 形式 (用 bits 32 编 
译 ) 是 一 样 的 ， 机 器 代码 都 是 


6A 55 


但 是 ， 当 它 执 行 时 ， 束 不 同 了 。 注 间 ， 无 论 在 什么 时 候 ， 处 理 右 部 
不 会 真 的 压 入 一 字 节 ， 要 么 压 入 字 ， 要 么 压 入 双 字 。 因 此 ， 在 16 位 模式 
下 ， 上 默认 的 操作 数字 长 是 16， 处 理 右 在 执行 时 ， 将 该 字 市 的 从 号 位 扩展 
到 高 8 位 ， 然 后 压 入 栈 ， 压 栈 时 使 用 SP 寄存 融 ， 且 先 将 SP 的 内 容 减 去 
2。 这 束 古 说 ， 实 际 压 入 栈 中 的 数值 是 0x0055; 在 32 位 模式 下 ， 压 入 的 


内 容 是 该 字 节 操作 数 符 号 位 扩展 到 高 24 位 的 结果 ， 即 0x00000055。 压 
栈 时 使 用 ESP 寄存 器 ， 且 先 将 ESP 的 内 容 减 去 4。 


如 果 压 入 的 是 字 操 作 数 ， 则 必须 用 关键 字 “word” 来 修饰 。 如 : 
push word Oxfffb 


在 16 位 模式 下 ， 默 认 的 操作 数字 长 是 16， 处 理 喜 在 执行 时 ， 直 接 压 
入 该 字 ， 压 栈 时 使 用 SP 寄存 器 ， 且 先 将 SP 的 内 容 减 去 2; 在 32 位 模式 
下 ， 压 入 的 内 容 是 该 操作 数 符 号 位 扩展 到 高 16 位 的 结果 ， 即 
0xFFFFFFFB， 压 栈 时 使 用 ESP 寄存 右 ， 有 日 先 将 ESP 的 内 容 减 去 4。 


如 有 果 压 入 的 是 双 字 操作 数 ， 则 必须 用 天 键 字 “dword" 来 修饰 。 如 : 
push dword Oxfb 
则 无 论 是 在 16 位 模式 下 ， 还 是 在 32 位 模式 下 ， 压 入 的 都 是 
0x000000FB， 而 且 栈 指针 寄存 锅 (SP 或 者 ESP) 都 匈 减 去 4。 
对 于 实际 操作 数位 于 通用 寄存 器 ， 或 者 位 于 内 存单 元 的 情况 ， 只 能 
压 入 字 或 者 双 字 ， 指 令 格式 为 : 


push r/ml16 
Bash r/m32 


如 琳 是 寄存 占 ， 则 可 以 使 用 16 位 或 者 32 位 的 通用 寄存 帝 。 比 如 : 


push ax 


push edx 


如 朵 饭庄 入 的 16 位 或 者 32 位 操作 数位 于 内 存单 元 中 ， 则 必须 用 关键 
字 “Word" 或 者 “dword" 修 饰 ， 以 指示 操作 数 的 大 小 : 


push Worgd [OX2000| 


push dword [ecxtesi*2+0x02] 
无 论 补 压 入 的 数位 于 寄存 器 ， 还 是 位 于 内 存单 元 ， 在 16 位 模式 下 ， 


如 果 压 入 的 是 字 操 作 数 ， 那 么 先 将 SP 的 内 容 减 去 2; 如 果 压 入 的 是 双 
字 ， 应 当先 将 SP 的 内 容 减 去 4。 在 32 位 模式 下 ， 如 果 压 入 的 是 字 操 作 


数 ， 那 么 和 完 将 ESP 的 内 容 减 去 2;， 如 果 压 入 的 是 双 字 ， 应 当先 将 ESP 的 


内 容 减 去 4。 


压 入 段 寄 存 右 的 操作 比较 特殊 。 以 下 是 压 入 段 寄 仓 的 push 指令 格 


式 : 


BUSN es 
Busn ds 
push es 
DS ES 
push gs 


Bus ss 


;机 器 指令 为 OE 
;机 器 指令 为 1E 
;机 器 指令 为 06 
;机 器 指令 为 OF A0 
;机 器 指令 为 OF A8 
;机 器 指 令 为 16 


在 16 位 模式 下 ， 先 将 SP 的 内 容 减 去 2， 然 后 卫 接 压 入 段 寄存 右 的 内 
容 ; 在 32 位 模式 下 ， 要 先 将 段 寄存 锅 的 内 容 用 等 扩展 到 32 位 ， 即 融 16 
位 为 全 零 。 然 后 ， 将 ESP 的 内 容 减 去 4， 册 压 入 扩展 后 的 32 位 值 。 


本 章 习 题 


1. 在 编译 阶段 ， 如 果 指 定 的 编 详 模 式 是 bits 16， 那 么 ，mov bx,16 
的 机 器 码 为 BB 10 00。 相 反 ，mov ebx,16 的 机 器 码 为 66 BB 10 00 00 
00。 试 间 ， 如 果 指 定 了 编译 模式 bits 32， 这 两 条 指令 编译 后 的 机 器 码 又 
分 别 是 什么 ? 


2. 以 下 程序 厂 靳 : 


bits 16 
moO Bx 6 BB L190 00 
ma Dx by 3 


将 生成 机 器 指令 序列 BB 10 00 F7 E3。 
当 处 理 喜 在 32 位 保护 模式 下 执行 这 些 代 人 码 时 ， 会 有 什么 问题 ? 
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一 般 来 说 ， 操 作 系 统 负 贡 整 个 计算 机 软 、 便 件 的 管 理 ， 它 做 任何 事 
情 都 是 可 以 的 。 但 是 ， 用 户 程 序 郑 应 当 有 所 限制 ， 只 允许 它 访 问 属 于 目 
己 的 数据 ， 即 使 是 转移 ， 也 只 允许 在 目 己 的 各 个 代码 段 之 间 进 行 。 


问题 在 于 ， 在 实 模 式 下 ， 用 户 程 序 对 内 存 的 访问 非常 目 由 ， 没 有 任 
何 限制 ， 随 随便 便 束 可 以 修改 任何 一 个 内 存单 元 。 比 如 以 下 代码 厂 世 ， 
它 完 保存 当前 的 数据 段 地 址 ， 然 后 修改 列 人 的 数据 ， 最 后 再 回 到 原先 的 
数据 段 : 


mov cx,0x8000 ;逻辑 段 地 址 

push ds 

mo ds,CcCxXx 

mov [0x05],dx ;好 辑 地 址 0x8000:0x0005， 即 物理 地 址 0x80005 
BOop ds 


很 显然 ， 即 使 物理 内 存单 元 0x80005 不 属于 当前 程序 ， 它 照样 可 以 
切换 到 那里 ， 并 随意 修改 其 中 的 内 容 。 最 车 怖 的 是 ， 如 果 那 个 地 方 古 操 
作 系 统 或 其 他 用 户 程 序 的 地盘 ”， 那 将 融 来 不 可 预料 的 后 琳 。 通 过 这 个 例 
于， 你 融 知 道 为 什么 很 多 人 能 通过 修改 内 存 中 的 数据 来 握 升 洲 戏 人 物 的 
法 力 和 生命 值 ， 并 获得 各 种 道具 。 

在 多 用 户 、 多 任务 时 代 ， 内 存 中 会 有 多 个 用 户 《 应 用 ) 程序 在 同时 
运行 。 为 了 使 它们 役 此 隔离 ， 防 止 因 祭 个 程序 的 编号 错误 或 者 朋 尝 而 影 
向 到 操作 系统 和 其 他 用 户 程 序 ， 使 用 你 护 模 式 古 非 第 有 必要 的 。 

本 章 学 习 目 标 : 

1. 了解 X86 处 理 右 的 你 护 模 式 需 要 先 定义 全 局 手 述 从 表 GDT， 认 识 
段 插 述 符 的 各 个 组 成 部 分 以 及 它们 的 含义 和 作用 。 

2. 认识 32 位 处 理 占 的 全 局 插 述 从 表 寄 存 右 GDTR、 上 段 守 和 存 带 (由 鼎 
选择 器 和 描述 符 高 速 缓存 器 组 成 ) 、 控 制 寄存 器 CR0 和 段 选择 子 。 

3. 了 解 进 入 32 位 你 护 柑 式 的 方法 和 步 又 。 





4. 学 习 保 护 模 式 下 的 一 些 程序 调试 技术 ， 如 察看 全 局 描述 符 表 
GDT、 段 寄存 器 和 控制 寄存 器 等 。 


5. 学 习 一 条 x86 处 理 器 的 新 指令 lgdt。 


11.1 ”代码 清单 11-1 





11.2 ”全 局 描述 符 表 


我 们 知道 ， 为 了 让 程序 在 内 存 中 能 目 由 译 动 而 又 不 影响 它 的 正常 执 
行 ， 处 理 需 将 内 存 划 分 成 馆 辑 上 的 段 ， 并 在 指令 中 使 用 段 内 偏 移 地 址 。 
在 保护 模式 下 ， 对 内 存 的 访问 仍然 使 用 段 地 址 和 侦 移 地 址 ， 但 是 ， 在 每 
个 段 能 够 访问 之 前 ， 必 须 先 进行 登记 。 

这 种 情况 好 有 一 比 。 束 像 是 开 公 司 做 生意 ， 在 实 模式 下 ， 开 公司 不 
需要 登记 ， 卖 什么 都 没有 人 管 ， 随 时 都 可 以 开张 。 但 在 保护 模式 下 就 不 
行 了 ， 开 公司 之 前 必须 先 登 记 ， 登 记 的 信息 包括 住址 〈 段 的 起 始 地 
址 ) 、 经 营 项 目 〈 段 的 界限 等 各 种 访问 属性 ) 。 这 样 ， 每 当 你 做 的 买卖 
和 你 的 注册 项 目 不 符 时 ， 就 会 被 阻止 。 对 段 的 访问 也 是 一 样 ， 当 你 访问 
的 偏 移 地 址 超出 段 的 界限 时 ， 处 理 器 就 会 阻止 这 种 访问 ， 并 产生 一 个 叫 
做 内 部 寞 营 的 中 靳 。 

和 一 个 段 有 关 的 信息 需要 8 个 字 太 来 揪 述 ， 所 以 称 为 段 摘 述 和 从 
(Segment Descriptor) ， 每 个 段 都 需要 一 个 摘 述 符 。 为 了 存放 这 些 摘 述 
符 ， 需 要 在 内 存 中 开辟 出 一 段 空 间 。 在 这 段 空 间 里 ， 所 有 的 描述 符 都 是 
换 在 一 起 ， 集 中 存放 的 ， 这 残 构成 一 个 描述 符 表 。 

最 主要 的 质 述 人 符 表 是 全 局 描述 符 表 (Global Descriptor Table ， 
GDT) ， 所 谓 全 局 ， 意 味 着 该 表 是 为 整个 软 人 硬件 系统 服务 的 。 在 进入 保 
护 模式 前 ， 必 须要 定义 全 局 摘 述 符 表 。 

如 图 11-1 所 示 ， 为 了 跟踪 全 局 摘 述 符 表 ， 处 理 需 内 部 有 一 个 48 位 的 
寄存 器 ， 称 为 全 局 描述 符 表 寄存 器 (GDTR ) 。 该 寄存 器 分 为 两 部 分 ， 分 
别 是 32 位 的 线性 地 址 和 16 位 的 边界 。32 位 的 处 理 器 具有 32 根 地 址 线 ， 
可 以 访问 的 地 址 范围 是 0x00000000 到 0xFFFFFFFF， 共 232 字 节 的 内 
存 ， 即 4GB 内 存 。 所 以 ，GDTR 的 32 位 线性 基地 址 部 分 保存 的 是 全 局 描 
述 符 表 在 内 存 中 的 起 始 线性 地 址 ，16 位 边界 部 分 保存 的 是 全 局 描述 符 表 
的 边界 〈 界 限 ) ， 其 在 数值 上 等 于 表 的 大 小 《总 字 节 数 ) 减 一 。 
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全 局 描述 符 表 线性 基地 址 全 局 描述 符 表 边界 


图 11-1 全 局 插 述 从 表 寄 存 带 GDTR 


换 名 话说， 全 局 描述 符 表 的 界限 值 束 是 表 内 最 后 1 季节 的 偶 移 量 。 第 
1 字 节 的 俩 移 量 是 0， 最 后 1 字 节 的 俩 移 量 是 表 大 小 减 一 。 如 朱 界 限 值 为 
0， 表 示 表 的 大 小 是 1 字 市 。 


因为 GDT 的 界限 是 16 位 的 ， 所 以 ， 访 表 最 大 是 216 字 节 ， 了 也 束 是 
65536 字 市 (64KB) 。 又 因为 一 个 描述 符 占 8 字 市 ， 故 最 多 可 以 定义 
8192 个 描述 人 符 。 实 际 上 ， 不 一 定 非 得 这 么 多 ， 到 上 确 有 多 少 ， 视 需要 而 
定 ， 但 最 多 不 能 超过 8192 个 。 

理论 上 ， 全 局 拍 述 从 表 可 以 位 于 内 和 存 中 的 任何 地 方 。 但 是 ， 如 图 11- 
2 所 示 ， 由 于 在 进入 保护 模式 之 后 ， 处 理 器 立即 要 按 新 的 内 存 访问 模式 工 
作 ， 所 以 ， 必 须 在 进入 保护 模式 之 前 定义 GDT。 但 是 ， 由 于 在 实 模式 下 
只 能 访问 1MB 的 内 存 ， 故 GDT 通常 都 定义 在 1MB 以 下 的 内 存 范 围 中 。 
当然 ， 人 允许 在 进入 保护 模式 之 后 换个 位 置 重 新 定义 GDT。 
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图 11-2 GDT 和 GDTR 的 关系 示意 图 
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11.3 ”存储 器 的 段 摘 述 
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和 往常 一 样 ， 在 程序 的 开始 部 分 要 
初始 化 段 盏 存 右 。 代 人 码 清 时 11-1 第 7 一 9 
行 用 于 初始 化 栈 ， 使 栈 段 的 馆 辑 段 地 址 
和 代码 段 相 同 ， 并 使 栈 指 针 寄 存 右 SP 指 
向 0x7c00。 这 是 个 分 界线 ， 从 这 里 ， 代 
人 码 同上 扩展 ， 而 栈 问 下 扩展 。 Po 


下 面 开始 定义 主 引 寻 矶 区 代 但 所 使 
用 的 数据 段 、 代 码 段 和 栈 段 。 在 你 护 模 
式 下 ， 内 和 存 的 访问 机 制 完全 个 同 ， 即 ， 
必须 通过 插 述 从 来 进行 。 所 以 ， 这 些 有 所 
必须 重新 在 GDT 中 定义 。 


先是 确定 GDT 的 起 始 线性 地 址 。 代 


人 码 清 单 11-1 第 96 行 ， 声明 了 标号 "co00 
gdt base 并 初始 化 了 一 个 双子 


0x00007e00， 我 们 决定 从 这 个 地 方 开 始 和 
创建 全 局 描述 符 表 (GDT) 。 这 是 有 意 | 

的 ， 如 图 11-3 所 示 ， 在 实 模式 下 ， 主 引 ?900000 

导 程序 的 加 载 位 置 是 0x0000:0x7c00， 也 图 11-3 进入 保护 检 式 前 的 内 存 映 党 
就 是 物理 地 址 0x07c00。 因 为 现在 的 地 址 

是 32 位 的 ， 所 以 它 现 在 对 应 着 物理 地 址 0x00007c00。 主 引导 扇 区 程序 共 
512 (0x200) 字 节 ， 所 以 ， 我 们 决定 把 GDT 设 在 主 引导 程序 之 后 ， 也 残 
是 物理 地 址 0x00007e00 处 。 因 为 GDT 最 大 可 以 为 64KB， 上 所以， 理论 
上 上 ， 它 的 尺寸 可 以 扩展 到 物理 地 址 0x00017dff 处 。 


相应 地 ， 因 为 栈 指 计 寄存 占 SP 被 初始 化 为 0x7c00， 和 CS 一 样 ， 术 § 
段 寄 存 右 SS 被 初始 化 为 0x0000， 而 且 栈 是 同 下 扩展 的 ， 所 以 ， 从 
0x00007c00 往 下 的 区 博 写 实际 上 可 用 的 栈 区 域 。 只 不 过 ， 该 区域 包 合 
很 多 BIOS 数据 ， 包 括 实 模式 下 的 中 断 癌 量 表 ， 所 以 一 定 要 小 心 。 这 是 没 
有 办 法 的 事 ， 在 实 模 式 下 ， 处 理 占 不 会 为 此 负责 ， 只 能 徘 你 上 自己 。 
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实 柑 式 和 你 护 柑 式 在 内 存 访 问 上 是 有 区 别 的 ， 在 你 护 模 式 下 ， 你 不 
能 说 访问 哪个 段 束 访问 哪个 段 ， 在 访问 之 前 ， 必 须 先 在 GDT 内 定义 要 访 
问 的 内 存 段 。 也 许 你 觉得 多 此 一 举 ,“ 想 访问 哪 段 和 内存 ， 我 融 在 GDT 中 是 
义 一 个 搬 述 从， 这 和 直接 访问 有 什么 区 别 ? 反正 也 能 随心 所 欲 ， 只 不 过 
多 了 一 道 手 续 ， 这 叉 谈 何 限制 和 你 护 呢 ?” 

实际 上 并 非 如 此 。 如 果 整 个 计算 机 系统 中 只 有 一 个 程序 在 工作 ， 那 
当然 是 正确 的 。 问 题 在 于 ， 会 有 很 多 程序 共同 在 操作 系统 上 运行 。 想 想 
你 平时 玩 的 电子 游戏 、 音 视频 播放 左 、WPS、Word、Excel， 捷 们 都 依 
乱 Windows 的 文 撑 才能 运行 。 所 以 ， 摘 述 符 不 是 由 用 户 程 序 目 己 建立 
的 ， 而 古 在 加 载 时 ， 由 拘 作 系统 根据 你 的 程序 结构 而 建立 的 ， 而 用 户 程 
序 通 第 是 无 法 建 并 和 修改 GDT 的 ， 也 了 欧 只 能 老 老 实 实 地 在 目 己 的 地 往 上 
工作 。 在 这 种 情况 下 ， 操 作 系 统 为 你 的 程序 建立 了 几 个 段 ， 你 束 只 能 在 
这 些 段 内 工作 ， 超 出 这 个 范围 ， 或 者 未 按 了 预定 的 方法 访问 这 些 段 ， 祁 将 
侯 处 理 问 阻止 。 


一 旦 确定 了 GDT 在 内 存 中 的 起 始 位 置 ， 下 一 步 的 工作 就 是 确定 要 访 
问 的 段 ， 并 在 GDT 中 为 这 些 段 创建 各 自 的 描述 符 。 

如 图 11-4 所 示 ， 每 个 描述 符 在 GDT 中 占 8 字 节 ， 也 就 是 2 个 双 字 ， 
或 者 说 是 64 位 。 图 中 ， 下 面 是 低 32 位 ， 上 面 是 高 32 位 。 
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图 11-4 ”存储 占 的 段 搬 述 从 格式 


很 明 旺 ， 描 述 符 中 指定 了 32 位 的 段 起 始 地 址 ， 以 及 20 位 的 段 边 界 。 
在 实 模式 下 ， 段 地 址 并 非 真 实 的 物理 地 址 ， 在 计算 物理 地 址 时 ， 还 要 左 
移 4 位 《〈 乘 以 16) 。 和 实 借 式 不 同 ， 在 32 位 你 护 模 式 下 ， 段 地 址 是 32 位 
的 线性 地 址 ， 如 末 未 开局 分 页 功能 ， 该 线性 地 址 吏 征 物理 地 址 。 页 功能 
将 在 第 16 革 和 第 17 章 讲 解 ， 而 且 开 局 页 功能 需要 做 很 多 准备 工作 。 目 
有 前， 如 果 没 有 特 列 说 明 ， 线 性 地 址 束 古 物理 地 址 。 手 述 从 中 的 段 基 地 址 
和 上 段 界限 不 是 连续 的 ， 把 它们 分 成 几 段 似乎 不 科学 。 但 这 也 古 没 有 办 法 


的 事 ， 这 是 从 80286 处 理 需 上 带 来 的 后 遗 症 。80286 也 是 16 位 的 处 理 
右 ， 也 有 保护 模式 ， 但 属于 16 位 的 保护 模式 。 而 且 ， 其 地 址 是 24 位 的 ， 
允许 访问 最 多 16MB 的 内 存 。 尽 管 80286 的 16 位 保护 模式 从 来 也 没 形成 
气候 ， 但 是 ，32 位 处 理 占 为 了 你 持 同 80286 的 兼容 ， 只 能 在 旧 摘 述 符 的 
格式 上 进行 扩充 ， 这 是 不 得 已 的 做 法 。 

段 基 地 址 可 以 是 0 一 4GB 范围 内 的 任意 地 址 ， 不 过 ， 还 是 建议 应 当选 
取 那 些 16 字 节 对 齐 的 地 址 。 尽 管 对 于 Intel 处 理 器 来 说 ， 人 允许 不 对 齐 的 地 
址 ， 但 是 ， 对 章 能够 使 程序 在 访问 代码 和 数据 时 的 性 能 最 大 化 。 这 一 
点 ， 对 于 那些 学 过 计算 机 原理 ， 特 别 是 了 解 内 存心 片 组 织 的 人 来 说 ， 是 
最 清 林 不 过 的 。 

20 位 的 段 界 限 用 来 限制 段 的 扩展 范围 。 因 为 访问 内 存 的 方法 是 用 段 
基地 址 加 上 偶 移 量 ， 所 以 ， 对 于 同上 扩展 的 段 ， 如 代码 段 和 数据 段 来 
说 ， 偏 移 量 是 从 0 开始 递增 ， 段 界限 决定 了 偏 移 量 的 最 大 值 ， 对 于 同 下 扩 - 
展 的 段 ， 如 栈 段 来 说 ， 段 界限 诀 定 了 偏 移 量 的 最 小 值 。 

G 位 是 粒度 〈Granularity) 位 ， 用 于 解释 段 界 限 的 含义 。 当 G 位 是 
0" 时 ， 段 界限 以 字 节 为 单位 。 此 时 ， 段 的 扩展 范围 是 从 1 字 节 到 1 兆 字 
节 (〈1B~ 1MB) ， 因 为 描述 符 中 的 界限 值 是 20 位 的 。 相 反 ， 如 果 该 位 是 
1， 那么 ， 段 界限 是 以 4KB 为 单位 的 。 这 样 ， 段 的 扩展 范围 是 从 4KB 到 
4GB。 


S 位 用 于 指定 描述 符 的 类 型 (Descriptor Type) 。 当 该 位 是 “0” 时 ， 
表示 是 一 个 系统 段 ， 为 “1 时， 表示 是 一 个 代码 段 或 者 数据 段 〈( 栈 段 也 是 
特殊 的 数据 段 ) 。 系 统 段 将 在 以 后 介绍 。 


DPL 表示 描述 符 的 特权 级 〈Descriptor Privilege Level，DPL) 。 这 
两 位 用 于 指定 段 的 特权 级 。 共 有 4 种 处 理 器 支持 的 特权 级 别 ， 分 别 是 0、 
1、2、3， 其 中 0 是 最 高 特权 级 别 ，3 是 最 低 特 权 级 别 。 刚 进入 保护 模式 
时 执行 的 代码 具有 最 高 特权 级 0 (可 以 看 成 是 从 处 理 占 那里 继承 来 的 ) ， 
这 些 代码 通常 都 是 操作 系统 代码 ， 因 此 它 的 特权 级 别 最 高 。 每 当 操 作 系 
统 加 载 一 个 用 户 程 序 时 ， 它 退 常 都 会 指定 一 个 和 低 的 特权 级 ， 比 如 3 特权 
级 。 不 同 特权 级 别 的 程序 是 互相 隔离 的 ， 其 互 访 是 严格 限制 的 ， 而 且 有 
些 处 理 器 指令 (特权 指令 ) 只 能 由 0 特权 级 的 程序 来 执行 ， 为 的 就 是 安 
a 

在 这 里 ， 摘 述 符 的 特权 级 用 于 指定 要 访问 该 段 所 必须 上 共有 的 最 低 特 
权 级 。 如 果 这 里 的 数值 是 2， 那 么 ， 只 有 特权 级 别 为 0、1 和 2 的 程序 才能 








访问 该 段 ， 而 特权 级 为 3 的 程序 访问 该 段 时 ， 处 理 吉 会 子 以 阻止 。 特 权 级 
将 在 以 后 专门 讲解 ， 谁 也 不 希望 目 己 的 特权 级 最 低 ， 何 况 现 在 有 随便 决 
定 段 特 权 级 别 的 目 由 。 那 么 ， 好 吧 ， 我 们 现在 一 律 将 特权 级 设 定 为 最 高 
的 0。 


P 是 段 存 在 位 “(Segment Present) 。P 位 用 于 指示 描述 符 所 对 应 的 
段 是 售 存 在 。 一 般 来 说 ， 摘 述 符 所 指示 的 段 都 位 于 内 存 中 。 但 是 ， 当 内 
存 空间 双 张 时 ， 有 可 能 只 是 建立 了 摘 述 符 ， 对 应 的 内 存 空 间 并 不 存在 ， 
这 时 ， 束 应 当 把 插 述 从 的 P 位 清 堆 ， 表 示 段 并 不 存在 。 另 外 ， 同 样 是 在 
内 存 空间 紧张 的 情况 下 ， 会 把 很 少 用 到 的 段 换 出 到 人 硬盘 中 ， 上 腾 出 空间 给 
当前 急需 内 存 的 程序 使 用 《〈 当 前 正在 执行 的 ) ， 这 时 ， 同 样 要 把 段 摘 述 
符 的 P 位 清 零 。 当 再 次 轮 到 它 执行 时 ， 再 装 入 内 存 ， 然 后 将 P 位 置 1。 

P 位 是 由 处 理 磊 负责 检 和 碍 的 。 每 当 通 过 摘 述 符 访 问 内 存 中 的 段 时 ， 
如 果 P 位 是 “0”"， 处 理 器 束 会 产生 一 个 异 单 中断 。 通 党 ， 该 中断 处 理 过 程 
是 由 操作 系统 提供 的 ， 该 处 理 过 程 的 任务 是 负责 将 该 段 从 人 硬盘 换 回 内 
存 ， 并 将 P 位 置 1。 在 多 用 户 、 多 任务 的 系统 中 ， 这 是 一 种 常用 的 虚拟 内 
存 调 度 策 略 。 当 内 存 很 小 ， 运 行 的 程序 很 多 时 ， 如 果 计 算 机 的 运行 速度 
变 慢 ， 并 位 随 看 澡 忙 的 硬盘 操作 时 ， 说 明 这 种 情况 正在 发 生 。 

D/B 位 是 “默认 的 操作 数 大 小 ”(Default Operation Size ) 或 者 “默认 
的 栈 指 针 大 小 ”(Default Stack Pointer Size ) ， 又 或 者 * 上 部 边界 ” 
(Upper Bound) 标志 。 

设立 该 标志 位 ， 主 要 是 为 了 能 够 在 32 位 处 理 器 上 兼容 运行 16 位 保护 
模式 的 程序 。 尽 管 这 种 程序 现在 已 经 非常 罕见 了 ， 但 它 毕 竟 存 在 过 ， 兼 
容 ， 这 是 Intel 公司 能 够 兴旺 友 达 的 重要 因素 。 


该 标记 位 对 不 同 的 段 有 个 同 的 效 霖 。 对 于 代 人 码 段 ， 此 位 称 做 “D" 位 ， 
用 于 指示 指令 中 献 认 的 偏 移 地 址 和 操作 数 尺 寸 。D 二 0 表示 指令 中 的 偶 移 
地 址 或 者 操作 数 是 16 位 的 ，D 二 1， 指 示 32 位 的 偏 移 地 址 或 者 操作 数 。 


举 个 例子 来 说 ， 如 有 果 代 码 段 描述 符 的 D 位 是 0， 那 么 ， 当 处 理 需 在 这 
个 段 上 执行 时 ， 将 使 用 16 位 的 指令 指针 寄存 器 IP 来 取 指 令 ， 人 否则 使 用 32 
位 的 EIP。 

对 于 栈 段 来 说 ， 该 位 被 叫做 "B" 位 ， 用 于 在 进行 隐 式 的 栈 操作 时 ， 是 
使 用 SP 寄存 器 还 是 ESP 寄存 器 。 隐 式 的 栈 操作 指令 包括 push、pop 和 
call 等 。 如 果 该 位 是 “0"， 在 访问 那个 段 时 ， 使 用 SP 寄存 希 ， 人 否则 瓯 是 使 
用 ESP 寄存 需 。 同 时 ，B 位 的 值 也 决定 了 栈 的 上 部 边界 。 如 果 B 二 0， 那 


么 栈 段 的 上 部 边界 (也 就 是 SP 寄存 占 的 最 大 值 ) 为 0xFFFF; 如 果 B= 三 
1， 那 么 栈 段 的 上 部 边界 (也 就 是 ESP 寄存 器 的 最 大 值 ) 为 
OxFFFFFFFF, 

对 于 本 书 来 说 ， 它 应 当 为 1"。 本 书 不 过 多 涉及 16 位 保护 模式 ， 它 已 
经 非 怨 守 册 了 % 

L 位 是 64 位 代码 段 标 志 (64-bit Code Segment) ， 保 留 此 位 给 64 
位 处 理 器 人 使用。 目前， 我 们 将 此 位 置 “0? 即 可 。 

TYPE 字段 共 4 位 ， 用 于 指示 摘 述 从 的 子 类 型 ， 或 者 说 是 类 别 。 如 表 
11-1 所 示 ， 对 于 数据 段 来 说 ， 这 4 位 分 别 是 X、E、W、A 位 ; 而 对 于 代 
伍 段 来 说 ， 这 4 位 则 分 别 是 X、C、R、A 位 。 

表 11-1 代码 段 和 数据 段 描述 符 的 TYPE 字段 
x 


TE 


只 执行 ， 依 从 的 代码 段 
执行 、 读 ， 依 从 的 代码 段 





WE 
WW | wm | | | 
| | 
| | 
I 
EY [3 
1 | 
Om | | 
| | | 


表 11-1 中 ，X 表示 是 否 可 以 执行 (eXecutable) 。 数 据 段 总 是 不 可 
执行 的 ，X 二 0; 代码 段 总 是 可 以 执行 的 ， 因 此 ，X= 三 1。 


对 于 数据 段 来 阅 ，E 位 指示 段 的 扩展 方向 。E=0 是 同上 扩展 的 ， 也 
束 古 问 融 地 址 方 同 扩展 的 ， 古 普通 的 数据 段 ，E 二 1 是 同 下 扩展 的 ， 也 融 
是 问 低 地 址 方 同 扩展 的 ， 通 常 是 栈 段 。W 位 指示 段 的 谈 与 属性 ， 或 者 说 
段 定 合 可 写 ，W=0 的 段 是 不 允许 号 入 的 ， 人 奋 则 会 外 友 处 理 带 弄 第 中 靳 ; 
W 三 1 的 段 古 可 以 正和 党 号 入 的 。 


对 于 代码 段 来 说 ，C 位 指示 段 是 否 为 特权 级 依从 的 
CConforming) 。C=0 表示 非 依 从 的 代码 段 ， 这 样 的 代码 段 可 以 从 与 它 
特权 级 相同 的 代码 段 调 用 ， 或 者 通过 门 调用 ; C=1 表示 允许 从 低 特 权 级 
的 程序 转移 到 该 段 执行 。 关 于 特权 级 和 特权 级 检查 的 知识 将 在 第 14 章 介 
绍 。R 位 指示 代码 段 是 否 允 许 读 出 。 代 码 段 总 是 可 以 执行 的 ， 但 是 ， 为 
了 防止 程序 被 破坏 ， 它 是 不 能 写 入 的 。 至 于 是 否 有 读 出 的 可 能 ， 由 R 位 


处 理 规 弄 利 中断 :如果 R 三 1， 则 代码 段 是 可 以 该 出 的 ， 即 可 以 把 这 个 段 
的 内 容 当 成 ROM 一 样 使 用 。 


也 许 有 人 会 问 ， 了 既然 代码 段 是 不 可 读 的 ， 那 处 理 融 怎么 从 里 面 取 指 
令 执 行 呢 ? 事实 上 ， 这 里 的 R 属性 并 非 用 来 限制 处 理 右 ， 而 是 用 来 限制 
程序 和 指令 的 行为 。 一 个 典型 的 例子 古 使 用 上段 超越 前 级 "CS: 来 访问 代码 
段 中 的 内 容 。 


数据 段 和 代码 段 的 A 位 是 已 访问 (Accessed) 位 ， 用 于 指示 它 所 指 
问 的 段 最 近 是 人 否 梓 访问 过 。 在 朱 述 符 创 建 的 时 候 ， 应 该 清 零 。 之 后 ， 每 
当 该 段 被 访问 时 ， 处 理 圳 目 动 将 该 位 置 “ 人 人。 对 该 位 的 清 零 旦 由 软件 《〈“ 操 
作 系 统 ) 负 贡 的 ， 通 过 定期 监视 该 位 的 状态 ， 束 可 以 统计 出 该 段 的 使 用 
频 座 。 当 内 和 存 空 间 紧 张 时 ， 可 以 把 不 经 党 使 用 的 段 退 避 到 价 稻 上， 从 而 
实现 虚拟 内 存 官 理 。 


AVL 是 软件 可 以 使 用 的 位 (Available，， 通 常 由 操作 系统 来 用 ， 处 
理 右 并 不 使 用 它 。 如 果 你 把 它 理 解 成 “好 吧 ， 该 安排 的 都 安排 了 ， 最 后 多 
出 这 么 一 位 ， 不 知道 干什么 用 好 ， 束 给 软件 用 吧 ”， 我 也 不 反对 ， 也 许 
Intel 公司 也 不 会 说 些 什 么 。 


11.4 ”安装 存储 器 的 段 描述 符 并 加 载 GDTR 


现在 开始 安 痛 各 个 拍 述 符 ， 让 我 们 回 到 代码 清早 11-1。 

不 要 到 了 ， 我 们 现在 还 处 于 实 便 式 下 。 因 此 ， 在 GDT 中 安放 搞 述 
人 符 ， 必 须 将 GDT 的 线性 地 址 (物理 地 址 〉 转换 成 逻辑 段 地 址 和 偏 移 地 
le 


GDT 的 线性 地 址 是 我 们 直接 给 出 的 ， 放 在 程序 中 的 标 写 gdt_base 
处 。 第 12 行 ， 将 GDT 线性 基地 址 的 低 16 位 传送 到 寄存 右 AX 中 。 和 从 前 
一 样 ， 这 里 使 用 了 上 段 超 越前 级 “cs: "， 表 明 是 访问 代码 段 中 的 数据 ; 又 因 
为 主 引 导 程 序 的 实际 加 载 位置 是 馆 辑 地 址 0x0000:0x7c00 ， 故 标号 
gdt_base 处 的 偏 移 地 址 是 gdt_base+0x7c00。 

同样 地 ， 第 13 行将 GDT 线性 基地 址 的 高 16 位 传送 到 寄存 器 DX。 

第 14 一 17 行将 线性 基地 址 转换 成 逻辑 地 址 ， 方 法 是 将 DX:AX 除 以 
16， 得 到 的 商 是 逻辑 段 地 址 ， 余 数 是 偏 移 地 址 。 接 着 ， 将 AX 中 的 逻辑 段 
地 址 传送 到 数据 段 寄 存 器 DS 中 ， 将 偏 移 地 址 传送 到 等 存 器 BX 中 。 

处 理 器 规定 ，GDT 中 的 第 一 个 摘 述 符 必 须 是 空 描述 符 ， 或 者 叫 哑 摘 
述 符 或 NULL 描述 符 ， 相 信 后 者 对 于 有 C 语言 经 历 的 读者 来 说 更 容易 接 


。 


很 多 时 候 ， 寄 存 器 和 内 存单 元 的 初始 值 会 为 0， 再 加 上 程序 设计 有 问 
题 ， 束 会 在 无 意 中 用 全 0 的 索引 来 选择 摘 述 符 。 因 此 ， 处 理 器 要 求 将 第 一 
个 插 述 从 定义 成 空 搬 述 从 。 

为 此 ， 第 20、21 行将 两 个 全 0 的 双 字 分 别 写 入 偏 移 地 址 为 BX 和 
BX+4 的 地 方 。 

进入 保护 模式 之 后 必然 要 从 一 个 代码 段 开 始 执行 。 现 在 惑 来 定义 代 
码 段 摘 述 符 。 

第 24、25 行 ， 接 着 安 装 代 个 段 接 述 从 ， 该 接 述 从 的 低 32 位 是 
0x7c0001ff， 高 32 位 是 0x00409800。 结 合 图 11-4 可 以 分 析出 ， 该 段 的 
基本 情况 为 : 


线性 基地 址 为 0x00007C00。 

段 界限 为 0x001FF， 粒 度 为 字 节 (G 二 0)。 该 段 的 长 度 为 512 字 节 。 
属于 存储 器 的 段 (Ss 二 1)。 

这 是 一 个 32 位 的 段 (D==1)。 

该 段 目前 位 于 内 存 中 (P= 二 1)。 

段 的 特权 级 为 0 (DPIL 王 00)。 

这 是 一 个 只 能 执行 的 代码 段 CTYPE=1000 )。 


很 明显 ， 该 描述 符 所 指 同 的 段 ， 束 是 现在 正在 执行 的 主 引 导 程 序 所 
在 的 区 域 。 如 图 11-5 所 示 ， 这 是 描述 符 各 字 节 在 内 存 中 的 映 象 。Intel 处 
理 需 是 低 端 字 节 序 的 ， 所 以 低 双 字 在 低地 址 问 ， 高 双 字 在 高 地 址 端 ; 低 
字 在 低地 址 问 ， 高 字 在 高 地 址 问 ， 低 字 贡 在 低地 址 疹 ， 高 字 节 在 高 地 址 
端 。 

第 28、29 行 ， 用 于 安装 一 个 数据 段 的 摘 述 符 。 对 照 图 11-4， 很 明 
显 ， 这 个 段 具 有 以 下 性 质 : 


线性 基地 址 为 0x000B8000。 

段 界限 为 0x0FEFEE， 粒 度 为 字 节 〈G=0)。 即 ， 该 段 的 长 度 为 64KB。 
属于 存储 器 的 段 〈Ss 三 1)。 

这 是 一 个 32 位 的 段 (D==1)。 

该 段 目前 位 于 内 存 中 (P= 二 1)。 

段 的 特权 级 为 0 (DPIL 王 00 )。 





这 是 一 个 可 读 可 号 、 同 上 扩展 的 数据 段 (TYPE=0010)。 


00 40 98 00 7L 00 01 FF 


十 0x07 
十 0x00 
十 Ox05 
十 Ox04 
0X03 
十 0x02 
十 0x01 
十 0x00 


一 ] 上 ~ 


wg Be 
MT 1 一 


图 11-5” 搓 述 符 各 个 字 节 在 内 存 中 的 映 象 


我 们 用 程序 在 屏幕 上 显示 内 容 已 经 不 是 一 次 两 次 了 ， 很 容易 看 出 ， 
线性 地 址 0x000b8000 束 是 显存 的 起 始 地 址 ， 看 起 来 ， 我 们 要 用 这 个 段 来 
显示 字符 。 

第 32、33 行 ， 用 于 安装 栈 段 的 描述 符 。 对 照 几 11-4， 访 段 的 性 质 如 
下 : 


线性 基地 址 为 0x00000000。 

段 界 限 为 0x07A00， 粒 度 为 字 节 (G 二 0)。 

属于 存储 器 的 段 (Ss 二 1)。 

这 是 一 个 32 位 的 段 (D==1)。 

该 段 目前 位 于 内 存 中 (P= 二 1)。 

段 的 特权 级 为 0 (DPL 二 00)。 

这 是 一 个 可 读 可 写 、 同 下 扩展 的 数据 段 ， 在 这 里 是 栈 段 (TYPE=0010)。 


在 这 里 ， 段 界限 的 值 0x07a00 加 上 1 (0x07a01) ， 就 是 ESP 寄存 器 
所 允许 的 最 小 值 。 当 执行 push、call 这 样 的 隐 式 栈 操作 时 ， 处 理 器 会 检 
查 ESP 寄存 需 的 值 ， 一 旦 发 现 它 小 于 等 于 这 里 指定 的 数值 ， 会 引发 异 帝 
中 断 。 关 于 栈 界 限 的 讨论 将 在 本 章 的 后 面 接着 进行 。 

好 了 ， 现 在 所 有 的 描述 从 都 已 经 安装 完毕 ， 接 下 来 的 工作 是 加 载 挡 
述 符 表 的 线性 基地 址 和 界限 到 GDTR 寄存 器 ， 这 要 使 用 lgdt 指令 ， 该 指 
令 有 的 格式 为 


lgdt m48 “lodt mleog&m32 


这 就 是 说 ， 该 指令 的 操作 数 是 一 个 48 位 (6 字 节 ) 的 内 存 区 域 。 在 
16 位 模式 下 ， 该 地 址 是 16 位 的 ; 在 32 位 模式 下 ， 该 地 址 是 32 位 的 。 该 
指令 在 实 模式 和 保护 模 陈 下 都 可 以 执行 。 

在 这 6 字 节 的 内 存 区域 中 ， 要 求 前 〈 低 ) 16 位 是 GDT 的 界限 值 ， 后 
(高 ) 32 位 是 GDT 的 基地 址 。 在 初始 状态 下 (计算 机 启动 之 后 〉， 
GDTR 的 基地 址 被 初始 化 为 0x00000000; 界限 值 为 0xFFFF。 


该 指 癌 个 影 啊 任何 标志 位 。 


为 些 ， 代 码 清单 11-1 第 36 行 ， 将 GDT 表 的 界限 值 31 写 入 标号 
gdt_ size 所 在 的 内 存单 元 。 这 里 共有 4 个 描述 符 ( 包 括 空 描述 符 ) ， 每 个 
描述 符 占 8 字 节 ， 一 共 是 32 字 节 。GDT 表 的 界限 值 是 表 的 总 字 节 数 减 去 
一 ， 所 以 是 31。 

接着 ， 第 38 行 ， 把 从 标号 gdt_size 开始 的 6 字 节 加 载 到 GDTR 寄存 


口 导 


如 订 : 
gdt es gdt srzer0x7c00] 


因为 gdt_size 和 gdt_base 十 连续 声明 的 ， 去 换 在 一 起 ， 所 以 ， 从 
gdt_size 处 读 取 6 个 字 节 ， 就 包括 了 gdt_ base。 注意 ， 到 目前 为 止 ， 我 
们 依然 工作 在 实 模式 下 ， 而 且 不 要 二 了 ， 指 令 中 的 俩 移 地 址 都 要 加 上 
0x7c00。 可 以 在 Bochs 中 察看 全 局 摘 述 人 符 表 GDT 的 内 容 ， 有 其 体 方 法 参见 
本 章 11.9.5 节 。 


检测 点 11.1 
1. 其 描述 符 是 64 位 的 0x004F9AFFFFFFFFFF， 请 问 ， 段 基地 址 
是 多 少 ? 段 界限 是 多 少 ?” G、D、L、AVL、P、DPL、S 和 TYPE 各 是 什 
大 
2. 32 位 保护 模式 下 ， 某 段 为 数据 段 ， 基 地 址 为 0x002FCOF0， 占 
的 长 度 为 2MB， 镁 度 为 4KB， 已 经 位 于 物理 内 存 中 ， 请 给 出 其 摘 述 符 的 
低 32 位 和 高 32 位 。 


11.5 “关于 第 21 条 地 址 线 A20 的 问题 


在 即将 进入 保护 模式 之 前 ， 这 里 还 涉及 一 个 历史 遗留 问题 ， 那 就 是 
处 理 器 的 第 21 根 地 址 线 ， 编 号 A20。"A" 是 Address 的 首 字符 ， 就 是 地 
址 ，A0 是 第 一 根 地 址 线 ，A31 是 第 32 根 地 址 线 ， 所 以 ，A20 束 是 第 21 
根 地 址 线 。 在 8086 处 理 器 上 运行 程序 不 存在 A20 问题 ， 因 为 它 只 有 20 
根 地 址 线 。 


实 模式 下 的 程序 只 能 寻 址 1MB 内 存 ， 那 是 因为 它 依 赖 16 位 的 段 地 址 
左 移 4 位， 加 上 16 位 的 偏 移 地 址 来 访问 内 存 。 当 逻辑 段 地 址 达到 最 大 值 
0xFFFF 时 ， 再 加 一 ， 就 会 因 进 位 而 绕 回 到 0x0000， 因 为 段 寄存 器 只 能 
保留 16 位 的 结果 。 人 至 于 有 段 内 偏 移 地 址 ， 也 是 如 此 。 


这 个 问题 可 以 从 男 一 个 角 展 来 解释 得 更 清楚 一 点 。 无 论 如 何 ， 从 
8086 处 理 器 外 部 来 看 ， 每 次 当 物 理 地 址 达到 最 高 端 0xFFFFF 时 ， 再 加 
一 ， 结 果 为 Ox100000。 但 因为 它 只 能 维持 20 位 的 地 址 ， 故 进位 目 然 丢 
失 ， 地 址 又 绕 回 最 低地 址 端 0x00000。 程 序 员 ， 你 是 知道 的 ， 他 们 喜欢 销 
研 ， 更 喜欢 利用 人 硬件 的 某 些 特性 来 展示 目 己 的 技术 ， 很 难说 在 当年 有 多 
少 程序 在 依赖 这 个 回 绕 特性 工作 着。 


到 了 80286 时 代 ， 处 理 器 有 24 条 地 址 线 ， 地 址 回 绕 好 像 不 灵 了 ， 
为 比 0x0FFFFF 大 的 数 是 0x100000，80286 处 理 器 可 以 维持 24 位 的 地 址 
数据 ， 进 位 不 会 被 丢弃 。 那 个 时 代 ， 正 是 商业 机 器 公司 IBM 生意 火红 的 
时 候 ， 主 导 看 个 人 计算 机 市 场 。 为 了 能 在 80286 处 理 旧 上 运行 8086 程序 
而 不 会 因 地 址 线 而 产生 问题 ， 它 们 决定 在 主板 上 动 一 动手 脚 。 

其 实 问题 的 解决 办 法 很 们 时， 只 雷 要 强制 第 21 根 地 址 线 恒 为 “0” 就 可 
以 了 。 这 样 ，0xOFFFFF 加 1 的 进位 被 强制 为 “0”， 结 果 是 0x000000; 再 
加 1， 是 0x000001，...... ， 水 远 和 实 模式 一 样 。 


于 是 ， 如 图 11-6 所 示 ，IBM 公司 使 用 一 个 与 门 来 控制 第 21 根 地 址 线 
A20， 并 把 这 个 与 门 的 控制 阀门 放 在 键盘 控制 器 内 ， 靖 口号 是 0x60。 问 
该 端口 写 入 数据 时 ， 如 果 第 1 位 是 “1”， 那 么 ， 键 盘 控 制 器 通 向 与 门 的 输 
出 就 为 “1”， 与 门 的 输出 就 取决 于 处 理 器 A20 是 “0” 还 是 “1”。 

不 过 ， 这 种 做 法 非常 烦琐 ， 因 为 要 访问 键盘 控制 器 ， 需 要 先 判断 状 
态 ， 要 等 竺 键盘 控制 右 不 忙 ， 人 至 少 需 要 十 几 个 步 又 ， 需 要 的 指令 数量 比 


本 章 的 代码 清单 11-1 还 多 。 


这 种 做 法 持续 了 若干 年 ， 直 到 80486 处 理 器 推出 后 ， 才 有 了 更 快速 
的 办 法 。 相 信和 在 此 期 间 ，lIntel 公司 和 IBM 公司 都 听 到 了 不 少 的 抱怨 ， 为 
什么 进入 保护 模式 这 么 厂 烦 ， 一 定 要 改 改 。 从 80486 处 理 器 开始 ， 处 理 
器 本 身 就 有 了 A20M# 引 脚 ， 意 思 是 A20 屏蔽 〈A20 Mask) ， 它 是 低 电 平 
有 效 的 。 





A0 
80286 | 
处 理 器 A23 
A20 
8042 键 盘 控制 器 接口 嘱 
0x60 端 图 | 





图 11-6 ”早期 的 A20 控制 打上 略 


如 图 11-7 所 示 ， 输 入 输出 控制 右 集 中 心 片 ICH 的 处 理 右 接口 部 分 ， 
有 一 个 用 于 兼容 老式 设备 的 端口 0x92， 第 7 一 2 位 保留 未 用 ， 第 0 位 叫做 
INIT_NOW， 意 思 是 “现在 初始 化 ”， 用 于 初始 化 处 理 硕 ， 当 和 它 从 0 过 滤 到 
1 时 ，ICH 蕊 片 会 使 处 理 右 INIT# 引 脚 的 电 平 变 低 《有效 ) ， 并 保持 至 少 
16 个 PCI 时 钟 周 期 。 通 俗 地 说 ， 同 这 个 端口 写 1， 将 会 使 处 理 絮 复位 ， 
导致 计算 机 重新 启动 。 





EU 


老式 键盘 控制 器 
端口 号 0x60 


ICH 芯 片 





图 11-7 ”改进 后 的 A20 控制 案 略 


端口 0x92 的 位 1 用 于 控制 A20 ， 叫做 替代 的 A20 门 控制 ( 
Alternate A20 Gate ， ALT A20 GATE)，， 它 和 来 自 键盘 控制 器 的 A20 
控制 线 一 起 ， 通 过 或 门 连接 到 处 理 器 的 A20M# 引 脚 。 和 使 用 键盘 控制 喜 
的 问 口 不 同 ， 通 过 0x92 并 口 显 得 非常 迅速 ， 也 非常 方 便 快捷 ， 因 此 称 为 
Fast A20, 

当 |INIT NOW 从 0 过 渡 到 1 时，ALT A20 GATE 将 被 置 “1”"。 这 就 是 
说 ， 计 算 机 启动 时 ， 第 21 根 地 址 线 是 自动 局 用 的 。A20M# 信 号 仅 用 于 单 
处 理 器 系统 ， 多 核 处 理 器 一 般 不 用 。 特 别 是 考虑 到 传统 的 键盘 控制 器 正 
逐渐 被 USB 键盘 代 蔡 ， 这 些 老式 设备 也 许 很 快 就 会 消失 。 

接着 来 看 代码 清单 11-1。 


端口 0x92 是 可 读 写 的 ， 第 40 一 42 行 ， 先 从 该 端口 读 出 原 数 据 ， 接 
痢 ， 将 第 2 位 (位 1) 置 “ 倍 ， 然 后 再 写 入 该 端口 ， 这 样 就 打开 了 A20。 


11.6 ”保护 模式 下 的 内 存 访 问 


一 路 披 诫 斩 严 之 后 ， 你 已 经 到 达 实 模式 和 保护 柑 式 的 分 界线 了。 同 
时 ， 你 也 会 友 现 ， 控 制 这 两 种 模式 切换 的 开关 原 是 在 一 个 叫 CR0 的 寄存 
让 

CR0 是 处 理 器 内 部 的 控制 寄存 器 (Control Register，CR) 。 之 所 
以 有 个 “0” 后 级 ， 是 因为 还 有 CR1、CR2、CR3 和 CR4 控制 寄存 器 ， 甚 至 
还 有 CR8。 


CR0 是 32 位 的 寄存 器 ， 包 含 了 一 系列 用 于 控制 处 理 器 操作 模式 和 运 
行 状态 的 标志 位 。 如 图 11-8 所 示 ， 它 的 第 1 位 〈 位 0) 是 保护 模式 允许 位 
(Protection Enable，PE〉， 是 开启 保护 模式 大 门 的 门 把 手 ， 如 果 把 该 
位 置 “1*"， 则 处 理 占 进入 保护 檬 式 ， 按 保护 模式 的 规则 开始 运行 。 你 可 能 
会 问 ， 为 什么 只 标识 了 一 个 PE 位 ， 还 把 图 画 那 么 大 。 很 简单 ， 随 着 讲解 
的 深入 ， 我 们 还 要 接触 其 他 标志 位 ， 把 图 的 比例 画 得 一 致 更 好 一 些 。 


Pp 
E 


图 11-8 控制 寄存 右 CRO 的 PE 位 


保护 模 陈 下 的 中 断 机 制 和 实 模式 不 同 ， 因 此 ， 原 有 的 中 断 问 量 表 不 
再 适用 ， 而 且 ， 必 须要 知道 的 是 ， 在 保护 模式 下 ，BIOS 中 断 都 不 能 
用 ， 因 为 它们 是 实 模式 下 的 代码 。 在 重新 设置 保护 模式 下 的 中 断 环 境 之 
前 ， 必 须 关 中 断 ， 这 惑 是 第 44 行 的 用 意 。 

第 46 行 ， 将 CRO 寄存 器 中 的 原 有 内 容 传 送 到 寄存 器 EAX， 准 备 修 
改 它 ; 第 47 行 ， 将 它 的 第 1 位 (位 0〉 置 “1”， 其 他 各 位 保持 原来 的 状态 
不 变 ; 第 48 行 ， 将 修改 之 后 的 内 容重 新 写 回 CR0， 这 直接 导致 处 理 器 的 
运行 变 成 你 护 模 式 。 

可 以 在 Bochs 调试 窗口 中 察看 各 个 控制 寄存 絮 的 内 容 ， 具 体 方法 参 
见 本 章 11.9.6 节 。 你 可 以 在 mov cr0,eax 指令 执行 前 和 执行 后 各 察看 一 
次 ， 重 点 关注 CRO0 寄存 鼎 PE 位 的 前 后 变化 。 


我 们 知道 ， 在 实 人 模式 下 ， 处 理 右 访问 内 存 有 的 方式 是 将 段 寄 和 存 占 的 内 
容 左 移 4 位 ， 再 加 上 偏 移 地 址 ， 以 形成 20 位 的 物理 地 址 。 


8086 处 理 器 的 段 寄 存 器 是 16 位 的 ， 共 有 4 个 : CS、DS、ES 和 
SS。 而 在 32 位 处 理 磊 内 ， 在 原先 的 基础 上 又 增加 了 两 不 段 寄存 器 FS 和 
GS。 


如 图 11-9 所 示 ，32 位 处 理 器 的 这 6 个 段 寄 存 器 又 分 为 两 部 分 ， 前 16 
位 和 8086 相同 ， 在 实 模 式 下 ， 它 们 用 于 按 传 统 的 方式 寻 址 1MB 内 存 ， 使 
用 方法 也 没有 变化 ， 所 以 使 得 8086 的 程序 可 以 继续 在 32 位 处 理 器 上 运 
行 。 同 时 ， 每 个 段 寄 存 需 还 包括 一 个 不 可 见 的 部 分 ， 称 为 描述 符 高 速 组 
存 郝 ， 用 来 存放 段 的 线性 基地 址 、 段 界限 和 段 属 性 。 既 然 不 可 见 ， 那 束 
是 处 理 器 不 希望 胆 我 们 访问 它 。 事实 上 ， 我 们 也 没有 任何 办 法 来 访问 这 些 
不 可 见 的 部 分 ， 它 是 由 处 理 需 内 部 使 用 的 。 
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图 11-9 32 位 处 理 器 内 的 段 寄存 器 


在 实 模 陈 下 ， 访 问 内 存 用 的 是 逸 辑 地 址 ， 即 将 段 地 址 乘 以 16， 上 再 加 
上 仿 移 地 址 。 下 面 古 一 个 例子 : 


moOY ER 0x2000 
moyv ds, Cx 
mov [Oxe0lyal 
mov Gx OXD8UG 
mov ds ;CX 


mov [Ox02],ah 


以 上 ， 肯 先 将 段 寄 和 存 带 DS 的 内 容 置 为 0xX2000， 这 十 远 辑 段 地 址 。 
接着 ， 同 该 段 内 偏 移 地 址 为 0x00c0 的 地 方 写 入 1 字 市 (在 寄存 器 AL 
中 ) ， 写 入 时 ， 处 理 帮 将 DS 的 内 容 左 移 4 位 ， 加 上 仿 移 地 址 ， 实 际 写 入 
的 物理 地 址 是 0x200c0。 


在 8086 处 理 器 上 ， 这 是 正确 的 。 但 是 ， 在 32 位 处 理 器 上 ， 这 个 过 
程 稍 有 不 同 。 首 先 ， 每 当 引 用 一 个 段 时 ， 处 理 喜 目 动 将 段 地 址 左 移 4 位 ， 
并 传送 到 摘 述 符 高 速 缓存 右 。 此 后 ， 就 一 直 使 用 描述 符 高 速 绥 存 吉 的 内 
容 作为 段 地 址 。 所 谓 引 用 一 个 段 ， 束 是 执行 将 段 地 址 传送 到 段 寄 存 右 的 
指令 。 如 


Jms. OQxf000:0x5000 


以 上 是 引用 代码 段 的 一 个 例子 ， 因 为 代码 段 的 修改 通 沼 是 用 转移 和 
调用 指令 进行 的 。 如 果 是 引用 数据 段 ， 则 一 般 采 用 以 下 形式 : 


movVv ax,0x2000 


mov ds,ax 


只 要 不 改变 段 寄 存 器 DS 的 内 容 ， 以 后 每 次 内 存 访问 都 直接 使 用 DS 
描述 符 高 速 缓存 器 中 的 内 容 。 但 是 ， 在 实 模式 下 只 能 辐 段 寄存 吉 传 送 16 
位 的 逻辑 段 地 址 〈 即 ， 处 理 器 不 把 它 看 成 是 描述 符 选 择 子 ) ， 故 ， 处 理 
器 仍然 只 能 访问 1MB 内 存 。 也 就 是 说 ， 在 实 模式 下 ， 段 寄存 器 描述 符 高 
速 缓存 器 的 内 容 仅 低 20 位 有 效 ， 高 12 位 全 部 是 零 。 

实 模式 下 的 6 个 段 寄存 器 CS、DS、ES、FS、GS 和 SS， 在 保护 模 
式 下 叫做 段 选择 器 。 和 实 模 式 不 同 ， 保 护 模式 的 内 存 访问 有 它 自 己 的 方 
式 。 在 保护 模式 下 ， 尽 管 访问 内 存 时 也 需要 指定 一 个 段 ， 但 传送 到 段 选 
择 需 的 内 容 不 是 逻辑 段 地 址 ， 而 是 段 描述 符 在 描述 符 表 中 的 索引 号 。 

如 图 11-10 所 示 ， 在 保护 模式 下 访问 一 个 段 时 ， 传 送 到 段 选择 器 的 是 
段 选择 子 。 它 由 三 部 分 组 成 ， 第 一 部 分 是 描述 符 的 索引 号 ， 用 来 在 描述 


符 表 中 选择 一 个 段 摘 述 符 。TI 是 描述 符 表 指示 器 〈Table Indicator) ，T| 
二 0 时 ， 表 示 描 述 符 在 GDT 中 ; TI=1 时 ， 描 述 符 在 LDT 中 。LDT 的 知 
识 将 在 后 面 进 行 介绍 ， 它 也 是 一 个 摘 述 符 表 ， 和 GDT 类 似 。RPL 是 请 求 
特权 级 ， 表 示 给 出 当前 选择 子 的 那个 程序 的 特权 级 别 ， 正 是 议程 序 要 求 
访问 这 个 内 存 段 。 每 个 程序 都 有 特权 级 别 ， 也 将 在 后 面 慢 慢 介绍 ， 现 在 
只 需要 将 这 两 位 置 成 "00? 即 可 。 
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图 11-10 ”上段 选择 子 的 组 成 


为 了 说 明 保 护 模 式 下 的 内 存 访问 ， 让 我 们 回 到 代码 清单 11-1。 前 面 
己 经 创建 了 全 局 描述 符 表 (GDT) ， 而 且 在 表 中 定义 了 4 个 段 描述 符 。 
数据 段 描 述 符 在 GDT 中 的 顺序 是 第 3 个 ， 因 为 编号 都 是 从 0 开始 的 ， 所 
以 它 的 索引 号 (或 者 叫 编号 、 权 位 号 ) 是 2。 

代码 清单 11-1 第 56、57 行 ， 将 接 述 从 选择 子 0x0010 (二 进 制 数 
0000 _0000 00010_0_00) 传送 到 段 选择 器 DS 中 。 从 选择 子 的 二 进 制 
形 却 可 以 看 出 ， 指 定 的 摘 述 符 索 引号 是 2， 指 定 的 摘 述 符 表 是 GDT， 请 求 
特权 级 RPL 是 00。 

GDT 的 线性 基地 址 在 GDTR 中 ， 又 因为 每 个 摘 述 符 占 8 字 市 ， 
此 ， 摘 述 符 在 表 内 的 偏 移 地 址 是 索引 号 乘 以 8。 如 图 11-11 所 示 ， 当 处 理 
器 在 执行 任何 改变 段 选择 器 的 指令 时 《比如 pop、mov、jmp far、call 
far、iret、retf) ， 束 将 指令 中 提供 的 索引 亏 乘 以 8 作为 偏 移 地 址 ， 同 
GDTR 中 提供 的 线性 基地 址 相 加 ， 以 访问 GDT。 如 果 没 有 发 现 什么 问题 
(比如 超出 了 GDT 的 界限 ) ， 吏 上 自动 将 找到 的 摘 述 符 加 载 到 不 可 见 的 摘 
述 符 高 速 缓存 部 分 。 


| 
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图 11-11 上 段 选 择 嚣 和 接 述 从 高 速 绥 存 器 的 加 载 过 程 


加 载 的 部 分 包括 段 的 线性 基地 址 、 段 界限 和 上 段 的 访问 属性 。 在 当前 
的 例子 中 ， 线 性 基地 址 是 0x000b8000， 段 界限 是 0xoffff， 段 的 属性 是 向 
上 扩展 ， 可 读 写 的 数据 段 ， 粒 度 为 字 节 。 

此 后 ， 每 当 有 访问 内 存 的 指令 时 ， 右 不 再 访问 GDT 中 的 摘 述 符 ， 和 直 
接 用 当前 段 寄存 器 描述 符 高 速 缓存 器 提供 线性 基地 址 。 因 此 ， 第 60 行 ， 
因为 指令 中 没有 上 段 超 越前 级 ， 故 默认 使 用 数据 段 寄存 占 DS。 如 图 11-12 
所 示 ， 执 行 这 条 指令 时 ， 处 理 器 用 DS 描述 符 高 速 缓存 中 的 线性 其 地 址 加 
上 指令 中 给 出 的 偏 移 量 0x00， 形 成 32 位 物理 地 址 0x000b8000， 并 将 字 
符 “P” 的 ASCII 码 写 入 该 处 。 





FFFFFEFFFR 


mov byte [0x00] ,'P’ 


B+) 


32 位 基地 址 


00000000 





os | 一 
图 11-12 ”保护 模式 下 的 内 存 访问 示意 


不 单单 是 访问 数据 段 ， 即 使 是 处 理 器 取 指 令 执 行 时 ， 也 采用 了 相同 
的 方法 。 如 图 11-13 所 示 ， 在 32 位 保护 模式 下 ， 处 理 器 使 用 的 指令 指针 
寄存 器 是 EIP。 假 设 已 经 从 描述 符 表 中 选择 了 一 个 段 描述 符 ，CS 描述 符 
高 速 缓存 器 已 经 装载 了 正确 的 32 位 线性 其 地址 ， 那 么 ， 当 处 理 器 取 指 令 
时 ， 会 自动 用 描述 符 高 速 缓存 器 中 的 32 位 线性 基地 址 加 上 指令 指针 寄存 
器 EIP 中 的 32 位 偏 移 量 ， 形 成 32 位 物理 地 址 ， 从 内 存 中 取得 执 令 并 加 以 
执行 。 同 时 ，EIP 的 内 容 上 自动 增加 以 指 癌 下 一 条 指令 。 当 前 指令 执行 完 
毕 之 后 ， 处 理 器 接着 按 上 述 方式 取 下 一 条 指令 加 以 执行 。 


FFEFFFFE | 


32 位 基地 址 





00000000 


图 11-13 ”保护 模式 下 处 理 占 取 指 令 的 过 程 示 意图 


11.7 ”清空 流水 线 并 串 行 化 处 理 需 


看 起 来 我 们 所 讲 的 内 容 有 些 超 前 了 ， 毕 葛 前 面 刚 刚 设 置 了 控制 寄存 
器 CRO0 的 PE 位 ， 处 理 嚣 刚刚 切换 到 保护 模式 下 。 看 起 来 一 切 都 很 简 
单 ， 拧 一 下 钥 是 ， 汽车 束 发 动 了 ， 不 是 吗 ? 

不 是 这 样 的 。 这 里 有 两 个 吸 待 解决 的 问题 。 

第 一 ， 正 如 上 一 节 所 述 ， 即 使 是 在 实 模式 下 ， 上 段 寄 存 器 的 描述 从 高 
速 缓存 器 也 被 用 于 访问 内 存 ， 仅 低 20 位 有 效 ， 高 12 位 是 全 零 。 当 处 理 器 
进入 保护 模式 后 ， 这 些 内 容 依 然 残 留 厦 ， 但 不 影响 使 用 ， 程 序 可 以 继续 
执行 。 但 是 ， 这 些 残 留 的 内 容 在 保护 模式 下 是 无 效 的 ， 述 时 会 在 执行 菜 
些 指令 的 时 候 出 问题 。 因 此 ， 比 较 安 全 的 做 法 是 尽快 刷新 CS、SS、 
DS、ES、FS 和 GS 的 内 容 ， 包 括 它 们 的 段 选 择 器 和 描述 符 高 速 缓存 


记忆 


丛 。 

第 二 ， 在 进入 保护 模式 前 ， 有 很 多 指令 已 经 进入 了 了 流水线。 因为 处 
理 右 工作 在 实 模 式 下 ， 所 以 它们 部 是 按 16 位 操作 数 和 16 位 地 址 长 度 进 行 
详 人 码 的 ， 即 使 是 那些 用 bits 32 编 详 的 指令 。 进 入 你 护 模 式 后 ， 受 CS 段 
搬 述 从 局 速 绥 存 带 中 实 模式 残留 内 容 的 影 响 ， 处 理 占 进入 16 位 你 护 模式 
工作 。 如 有 果 保 护 模 式 下 的 代码 是 16 位 的 ， 影 响 可 能 不 大 ， 但 如 采 是 用 
bits 32 编 详 的 ， 那 么 ， 由 于 对 对 操作 数 和 默认 地 址 大 小 的 解释 不 同 ， 指 
令 的 执行 结 末 可 能 会 不 正确 ， 所 以 必须 清空 汽水 线 。 同 时 ， 那 些 通过 型 
序 执行 得 到 的 中 间 结 来 也 十 无 效 的 ， 必 须 消 理 挥 ， 让 处 理 闫 串 行 化 执 
行 ， 即 ， 午 狐 按 指令 的 目 然 顺序 执行 。 

怎么 办 呢 ? 这 里 有 一 个 两 全 其 美的 方案 ， 那 融和 是 使 用 远 转 移 指令 jmp 
或 者 远 过 程 调 用 指令 call。 处 理 桌 最 怕 转 移 指令 ， 过 到 这 种 指令 ， 一 般 会 
清空 流水 线 ， 并 品行 化 执行 ;为 一 方面 ， 远 转移 会 重新 加 载 段 选择 如 
CS， 并 刷新 摘 述 符 高 速 缓存 疮 中 的 内 容 。 一 个 建议 的 方法 是 在 设置 了 控 
制 寄 人 存 蓝 CRO 的 PE 位 之 后 ， 立 即 用 jmp 或 者 call 转移 到 当前 指令 流 的 下 
一 条 指令 上 。 为 此 ， 人 代码 清单 11-1 第 51 行 ， 用 32 位 远 转 移 指 令 来 转移 
到 案 控 看 当前 指令 的 下 一 条 指令 : 


nD dword 0x0008: 王 ashn 


这 条 指令 和 位 于 它 前 面 的 指令 一 样 ， 默 认 地 是 用 “bits 16” 编 译 的 ， 而 
日 使 用 了 关键 字 “dword”， 该 关键 字 修 饰 偏 移 地 址 ， 意 思 是 要 求 使 用 32 位 
的 偏 移 量 。 因 此 ， 会 有 指令 前 级 0x66， 编 译 之 后 的 结果 是 


Ge EA B80 O00 00 V0 98 00 


实际 上 ， 因 为 处 理 此 现在 处 于 16 位 保护 模式 ， 议 到 捕 还 契 16 位 模 
式 ， 因 此 ， 使 用 以 下 的 16 位 远 转 移 指 令 可 能 更 目 然 一 些 : 


mp Ox0008 wsh 
如 果 使 用 这 条 指令 ， 那 么 ， 同 样 用 “bits 16” 编 译 ， 生 成 的 机 器 指令 是 
EA 7B 00 08 00 


16 位 的 绝对 远 转移 指令 只 有 5 个 字 节 ， 使 用 16 位 的 偏 移 量 。 因 此 ， 
它 会 使 标号 flush 的 汇编 地 址 相应 地 变 小 ， 变 成 0x007B， 而 不 是 从 前 的 
0x0080。 


16 位 保护 模式 是 从 80286 处 理 嚣 开始 引入 的 ，80286 没有 对 8086 
的 寄存 器 进行 扩展 ， 依 然 使 用 AX、BX、CX、DX、SI、DI、BP、SP， 
等 等 。 所 以 ， 在 16 位 保护 模式 下 ， 段 可 以 起 始 于 任何 地 方 ， 但 每 个 段 的 
最 大 长 度 是 64KB， 只 使 用 16 位 的 偏 移 量 。16 位 保护 模式 并 不 重要 ， 为 
了 统 开 它 ， 我 们 才 在 这 里 使 用 了 32 位 的 远 转 移 指令 。 

注意 ， 不管 你 用 的 是 16 位 远 转移 ， 还 是 32 位 远 转 移 ， 因 为 现在 
己 经 处 于 保护 模式 下 ， 处 理 喜 都 将 把 第 一 个 操作 数 0x0008 视 为 段 选 
择 子 ， 而 不 是 实 模式 下 的 逻辑 段 地 址 。 

因为 处 理 占 实际 上 是 在 保护 模式 下 执行 该 指令 的 ， 因 此 ， 它 会 重新 
解释 这 条 指令 的 含义 。 我 们 知道 ， 操 作 数 的 默认 大 小 《〈16 位 还 是 32 位 ) 
是 由 描述 符 的 D 位 决定 的 ， 确 切 地 说 ， 是 由 段 寄 存 缉 的 描述 符 高 速 缓存 
右 中 的 D 位 决定 的 ， 毕 竟 ， 要 访问 一 个 段 ， 必 须 首 先 将 它 的 摘 述 符 传 送 
到 段 寄 存 器 的 描述 符 高 速 缓存 器 中 。 当 它 刚 进入 保护 模式 时 ，CS 的 描述 
从 高 速 缓 存 右 依然 保留 着 实 模 式 时 的 内 容 ， 其 D 位 是 “0"， 因 此 ， 在 那个 
时 刻 ， 处 理 喜 运行 在 16 位 保护 模式 下 。 

因为 处 理 需 已 经 进入 保护 模式 ， 所 以 ，0x0008 不 再 是 逻辑 段 地 址 ， 
而 是 保护 模式 下 的 段 描述 符 选 择 子 。 在 前 面 定 义 GDT 的 时 候 ， 它 的 第 2 
个 (1 号) 接 述 从 对 应 看 你 护 模 式 下 的 代码 上段。 因此， 其 选择 子 为 


0x0008 索引 号 为 1(，TI 位 是 0，RPL 为 00) 。 当 指令 执行 时 ， 处 理 器 
加 载 段 选择 器 CS， 从 GDT 中 取出 相应 的 描述 符 加 载 到 CS 接 述 符 高 速 绥 
仔 。 


保护 模式 下 的 代码 段 ， 基 地 址 为 0x00007c00， 段 界限 为 0x1ff， 长 度 
为 0x200， 正 好 对 应 看 当前 程序 在 内 存 中 的 区 域 。 在 这 种 情况 下 ， 上 和 面 那 
条 指令 执行 时 ， 上 目标 位 置 在 段 内 的 偏 移 量 就 是 标号 flush 的 汇编 地 址 ， 处 
理 磊 用 它 的 数值 来 代 痊 指令 指针 寄存 堪 EIP 的 原 有 内 容 。 


在 16 位 保护 模式 下 执行 带 前 级 0x66 的 指令 ， 那 么 ， 很 好 ， 人 处 理 器 会 
按 32 位 的 方式 执行 ， 使 用 32 位 的 偏 移 量 。 于 是 ， 它 将 0x0008 加 载 到 CS 
选择 器 ， 并 从 GDT 中 取出 对 应 的 描述 符 ， 加 载 CS 描述 符 高 速 缓存 器 ; 
同时 ， 把 指令 中 给 出 的 32 位 偏 移 量 传送 到 指令 指针 寄存 器 EIP。 很 自然 
地 ， 处 理 器 就 从 新 的 位 置 开 始 取 指令 执行 了 。 

可 以 在 Bochs 中 观 罕 段 突 存 右 在 各 个 阶段 的 状态 ， 包 括 计 算 机 加 电 
后 、 设 置 CR0 寄存 器 的 PE 位 后 和 执行 JMP 指令 后 的 状态 。 具 体 方法 请 
参见 本 章 11.9.2、11.9.3 和 11.9.4 节 。 通 过 了 解 这 些 状 态 变 化 ， 可 以 进 一 
步 加 深 对 处 理 器 如 何 进入 保护 模式 的 理解 。 

从 进入 保护 模式 开始 ， 之 后 的 指令 都 应 当 是 按 32 位 操作 数 方式 编 详 
的 。 因 此 ， 第 53 行 ， 使 用 了 伪 指 令 [bits 32]。 当 处 理 占 执行 到 这 里 时 ， 
它 会 按 32 位 模式 进行 译 码 ， 这 正 是 我 们 所 希望 的 。 

代码 清单 11-1 第 56 一 74 行 ， 用 于 把 摘 述 符 选 择 子 0x10 加 载 到 段 选 
择 右 DS， 并 目 动 加 载 拉 述 人 符 高 速 绥 存 器 。 因 为 该 数据 段 实 际 上 是 文本 模 
式 下 的 显示 绥 神 区 ， 故 大 部 分 指令 都 用 于 在 屏幕 上 显示 字符 串 “Protect 
mode OK"。 保 护 模 式 下 的 数据 段 访 问 已 经 在 上 一 节 里 讨论 过 了 ， 这 里 不 
再 敬 述 。 另 外 ， 处 理 器 模式 的 变化 对 外 围 设 备 没 有 影响 ， 它 们 是 无 法 感 
知 的 ， 而 且 只 按 上 自己 的 方式 工作 。 

注意， 在 保护 模式 下 ， 不 允许 使 用 mov 指令 改变 段 寄 人 存 器 CS 的 内 
容 ， 比 如 : 


MmOV ‘CS, a 


企图 这 样 做 将 导致 处 理 右 产生 一 个 无 效 操作 但 的 开关 中 断 。 


11.8 保护 模式 下 的 栈 
11.8.1 关于 栈 段 描述 从 中 的 界限 值 


第 77 一 79 行 用 于 初始 化 保护 模式 下 的 栈 。 栈 段 摘 述 符 是 GDT 中 的 
第 4 个 (3 号 ) 描述 符 ， 栈 的 32 位 线性 基地 址 是 0x00000000， 段 界限 为 
0x07a00， 镁 度 为 字 节 ， 属 于 可 读 可 写 、 辐 下 扩展 的 数据 段 。 

栈 是 同 下 扩展 的 ， 因 此 ， 摘 述 符 中 的 段 界 限 ， 和 同上 扩展 的 段 舍 》 
不 同 。 对 于 同上 扩展 的 段 ， 段 内 偏 移 量 是 从 0 开始 递增 ， 偏 移 量 的 最 大 值 
是 界限 值 和 粒度 的 乘积 ， 而 对 于 同 下 扩展 的 段 来 说 ， 因 为 它 经 常用 做 栈 
上段， 而 栈 是 从 高 地 址 问 低 地 址 方 回 推进 的 ， 故 段 内 偏 移 量 的 最 小 值 是 界 
限 值 和 粒度 的 乘积 加 一 。 在 32 位 代码 中 ， 是 用 ESP 作为 栈 指 针 的 。 
些 ， 这 里 的 段 界限 ， 用 来 和 上 段 粒 撒 一 起 ， 决 定 ESP 寄存 需 所 能 具有 的 最 
小 值 。 即 ， 栈 操作 时 ， 必 须 符合 条 件 : 


ESP > 段 界限 X 粒 度 值 


对 于 描述 符 中 G 位 是 “0” 的 段 来 说 ， 粒 度 值 是 1 ( 字 节 ) ; 而 对 于 G 
位 是 “1 的 段 来 说 ， 粒 度 值 是 4096 (4KB) 。 

在 当前 代码 中 ，ESP 寄存 器 的 内 容 被 初始 化 为 0x00007c00。 假 如 此 
时 执行 以 下 指令 : 


push edx 


那么 ， 因 为 要 压 入 一 个 32 位 数 ， 所 以 处 理 问 先 将 ESP 的 内 容 减 去 
4， 再 压 入 数据 。 此 时 ，ESP 寄存 此 的 内 容 为 (扩展 到 32 位 ) : 


Ox000071C00~—4 二 0x0000 7BFC 


在 当前 栈 段 的 描述 符 中 ， 段 界限 为 0x07a00， 粒 度 是 字 节 ， 故 作为 栈 
的 措 限 ， 实 际 使 用 的 数值 是 “扩展 到 32 位 ) : 


0xX07A00 久 1 王 0X00007AO00 


对 于 栈 段 来 说 ， 段 界限 的 值 加 一 ， 束 是 段 内 偏 移 量 的 最 小 值 。 因 为 
要 访问 的 段 内 偏 移 量 0x00007BFC 大 于 实际 使 用 的 段 界限 值 
0x00007A00， 故 处 理 器 允许 执行 该 操作 ， 并 用 摘 述 人 符 高 速 绥 存 中 的 32 
位 基地 址 0x00000000 加 上 这 里 的 偏 移 量 0x00007BFC， 共 同形 成 32 位 
线性 地 址 访问 栈 ， 将 寄存 器 EDX 的 内 容 压 入 。 人 否则 ， 处 理 器 阻止 当前 操 
作 ， 引 发 一 个 异 单 中断。 

你 可 能 觉得 当前 的 栈 段 很 完美 。 但 不 得 不 说 ， 这 是 一 个 非常 糟糕 的 
栈 定 义 。 结 合 本 章 的 程序 ， 很 明显 ， 我 们 的 本 意 是 要 定义 一 个 只 有 512 
字 节 的 栈 空间 ， 从 物理 地 址 0x00007A00 开始 ， 到 物理 地 址 0x00007C00 
结束 ， 如 图 11-14 所 示 。 


FFEFFEFFEFF 


实际 可 以 访问 的 栈 空间 


00007C00 


ESP 程序 中 定义 的 栈 空间 
ll 


00000000 


图 11-14 ” 栈 段 的 界限 和 栈 的 安全 访问 


尽管 我 们 的 本 意 是 定义 一 个 只 有 512 个 字 节 的 栈 ， 但 是 ， 从 该 段 的 
摘 述 符 来 看 ， 这 个 段 的 空间 却 是 非常 巨大 的 。 假 如 一 切 正 各 ， 特 别 是 指 
令 执 行 正常 ， 那 不 会 有 什么 问题 。 但 是 ， 在 程序 失控 的 情况 下 ，ESP 的 
内 容 可 能 会 是 任何 预料 不 到 的 值 ， 比 如 0xFFFFFFFF。 即 使 是 这 样 ， 它 
也 是 合法 的 值 ， 毕 竟 它 大 于 0x00007A00。 因 为 当前 栈 段 的 线性 基地 址 为 
0x00000000， 上 所以， 实际 可 以 访问 的 空间 是 从 物理 地 址 0xFFFFFFFF 到 
0x00007A00。 显 然 ， 这 超出 了 我 们 的 预期 。 在 下 一 和 章 里 ， 我 们 将 继续 讨 
论 如 何 用 更 好 的 方法 来 创建 栈 。 





11.8.2 ”检验 32 位 下 的 栈 操作 


代码 清单 11-1 中 ， 最 后 的 指令 用 于 演示 你 护 檬 式 下 的 栈 操 作 。 我 们 
己 经 知道 ， 对 于 存储 融 的 段 来 说 ， 其 描述 符 的 DB 位 ， 对 于 代 但 段 来 

隐 式 的 栈 操作 (push、pop、call、ret 和 iret) 涉及 两 个 段 : 一 个 是 
指令 所 在 的 代码 段 ， 男 一 个 是 指令 执行 时 ， 所 使 用 的 栈 段 。 正 如 上 一 章 
所 述 ，16 位 下 的 栈 操 作 ， 其 默认 的 操作 数 大 小 是 16 位 的 ， 而 且 使 用 的 栈 
指针 寄存 器 是 SP; 32 位 下 的 隐 式 栈 操作 ， 其 默认 的 操作 数 大 小 是 32 位 
的 ， 使 用 ESP 寄存 器 。 


在 本 章 里 ， 当 前 程序 的 代码 段 ， 其 描述 符 的 D 位 是 1”， 所 以 ， 当 进 
行 隐 式 的 栈 操作 时 ， 默 认 地 ， 每 次 压 栈 操作 时 ， 压 入 的 是 双 字 ; 当前 程 
序 所 使 用 的 栈 段 ， 其 符 述 符 的 B 位 也 是 “1"， 默 认 地 ， 使 用 栈 指针 寄存 器 
ESP 进行 操作 。 为 此 ， 从 第 81 行 开 始 的 指令 用 于 检验 这 个 事实 。 

因此 ， 第 81 行 ， 先 保存 当前 栈 指针 的 内 容 到 EBP 寄存 器 ; 接着， 第 
82 行 ， 回 栈 中 压 入 立即 数 。 该 立即 数 为 字符 "的 ASCI 码 ， 这 个 值 是 在 
编译 阶段 计算 的 。 

因为 当前 正在 执行 的 代码 段 是 32 位 的 ， 其 描述 符 的 D 位 是 1"， 故 
push 指令 默认 的 操作 数 大 小 是 32 位 。 正 如 在 上 一 章 里 所 讲 的 ， 关 键 字 
“byte” 仅 仅 是 给 编译 器 用 的 ， 告 诉 它 ， 该 指令 对 应 的 格式 为 push imm8， 
必须 使 用 操作 人 码 0x6A， 而 不 是 用 来 在 编译 后 的 机 堪 指 令 前 添加 指令 前 
级 。 因 此 ， 该 指令 实际 在 处 理 器 上 执行 时 ， 压 入 栈 中 的 是 一 个 双 字 ， 也 
就 是 4 字 节 ， 高 24 位 是 该 字 节 符号 的 扩展 。 

当前 指令 执行 时 ， 所 访问 的 栈 ， 其 描述 符 的 B 位 也 是 “1”， 故 人 处理 器 
在 进行 栈 操作 时 ， 用 的 是 32 位 栈 指针 寄存 器 ESP。 它 首先 将 ESP 的 内 容 
减 去 4， 有 再 与 入 数值 ， 数 据 保 存 的 位 置 是 SS:ESP。 


现在 ， 理 论 上 ， 将 EBP 的 内 容 减 去 4 之 后 ， 应 该 和 ESP 的 内 容 相 
同 。 为 了 证 实 这 一 点 ， 第 84 一 86 行 ， 将 原先 保存 的 EBP 内 容 减 去 4， 再 
和 现行 的 ESP 比较 ， 看 是 否 相 等 。 如 果 相 等 ， 则 立即 将 刚才 压 入 的 字符 
出 栈 ， 并 显示 在 前 面 的 字符 串 后 。 不 存在 从 栈 中 弹出 字 节 的 指令 ， 因 为 
名 义 上 可 以 压 入 字 节 ， 但 实际 上 它们 是 作为 16 位 或 者 32 位 有 符号 数 压 入 
的 。 


当然 ， 如 果 经 过 验证 ，EBP 和 ESP 不 相等 ， 那 么 ， 将 不 会 显示 名 
点 ， 直 接 转 移 到 程序 的 最 后 ， 执 行 俘 机 指令 。 因 为 现在 已 经 茶 止 了 中 
汤 ， 故 除了 NMI， 没 有 任何 原因 会 导致 处 理 絮 被 激活 。 

检测 点 11.2 

1. 用 Bochs 调试 本 章 的 程序 ， 在 第 84 行 ， Bjsub ebp,4 处 设置 靳 
点 ， 观 察 栈 的 状态 。 此 时 ， 栈 顶 的 双 字 数据 是 ( ) 。 

2， 以 下 说 法 ， 哪 些 是 正确 的 〈 可 多 选 ) ” 

A. 在 x86 处 理 需 的 实 模式 下 ， 可 以 在 栈 中 压 入 16 位 或 者 32 位 数 
据 。 

B. 在 x86 处 理 器 的 32 位 保护 模式 下 ， 可 以 在 栈 中 压 入 16 位 或 者 32 
位 数据 。 

C. 在 x86 处 理 右 的 32 位 保护 模式 下 ， 如 果 栈 段 描述 符 的 B 位 是 0， 
则 使 用 SP 寄存 器 。 压 入 16 位 数据 时 ， 是 SP 先 减 去 2， 压 入 32 位 数据 
时 ， 是 SP 先 减 去 4。 

D. 在 x86 处 理 需 的 32 位 保护 模式 下 ， 如 果 栈 段 描述 符 的 B 位 是 1， 
则 使 用 ESP 寄存 器 。 压 入 16 位 数据 时 ， 是 ESP 先 减 去 2; 压 入 32 位 数 
据 时 ， 是 ESP 先 减 去 4。 

E. 在 x86 处 理 右 的 32 位 保护 模式 下 ， 只 能 在 栈 中 压 入 32 位 数据 。 


11.9 ”程序 的 运行 和 调试 
11.9.1 运行 程序 并 观察 结 
编译 代码 清单 11-1， 生 成 二 进 制 文件 c11_mbrbin 。 用 FixVhdWr 工 


具 将 此 文件 号 入 虚拟 使 盘 的 主 引 寻 忆 区 ， 然 后 局 动 虚拟 机 ， 如 果 疫 有 问 
题 的 话 ， 受 示 的 结 末 应当 如 图 11-15 所 示 。 





LEARN-ASM [正在 运行 ] - Oracle VM VirtualBox "一 bX 











俏 归 国信 | 和 园 Right Ctrl 


图 11-15 ”本 章程 序 的 运行 结 来 


11.9.2 ”处 理 器 刚 加 电 时 的 段 寄 存 器 状态 


在 x86 处 理 旨 加 电 后 ， 它 的 固件 会 对 目 身 进行 初始 化 ， 可 选 地 ， 还 
可 以 执行 一 个 内 置 的 自 测 试 (Build-In Self-Test，BIST) 。 如 果 执 行 了 
BIST， 那 么 ， 当 测试 通过 后 ，EAX 寄存 器 被 清 零 ， 人 否则 ，EAX 的 内 容 为 
非 零 。 如 果 不 执行 BIST， 那 么 ，EAX 寄存 器 的 内 容 默认 地 也 是 0。 在 这 
些 工 作 完 成 后 ， 才 开始 取 指 令 和 执行 指令 。 

人 不管 怎样 ， 当 处 理 关 初始 化 完成 后 ， 它 内 部 的 各 个 寄存 左 ， 包 括 通 
用 寄存 硕 、 段 寄存 希 、 控 制 寄存 左 、 指 令 指针 寄存 硕 EIP、 栈 指针 寄存 堪 
ESP， 以 及 我 们 疝 未 接触 过 的 其 他 寄存 硕 ， 都 会 有 一 个 预 置 的 仁 。 全 于 
它们 的 初始 全 是 什么 ， 可 以 碍 阅 相 天资 料 ， 比 如 INTEL 公司 的 手册 Intel@ 
64 and IA-32 Architectures Software Developers Manual， 它 和 本 书 一 


起 ， 是 你 守 头 必 备 的 节 on (网 上 有 大 量 的 下 载 链 接 ) 。 当 然 ， 如 果 不 想 
查阅 手册 ，Bochs 也 能 帮 上 你 的 忙 


Bochs 征用 软件 来 便 拟 处 理 顺 的 工作 ， 所 以 它 有 这 个 能 力 。 要 和 想 知 
道 处 理 器 加 电 后 ， 各 个 寄存 器 都 预 置 了 什么 内 容 ， 可 以 选择 在 它 执行 第 
一 条 指令 之 前 ， 使 用 调试 命令 来 显示 它们 . 比如 ， 可 以 用 “rr 命 令 显 示 各 

个 通用 寄存 噩 的 初始 内 容 。 当 然 ， 我 们 现在 只 想 知 道 各 个 段 寄 存 器 中 都 
有 些 什 么 。 


如 图 11-16 所 示 ， 在 处 理 占 开始 执行 它 本 次 加 电 以 来 的 第 一 条 指令 
前 ， 可 以 用 “sreg" 命 令 聚 看 各 个 段 寄存 占 此 时 的 状态 。 显 然 ， 段 寄存 砷 
CS 的 内 容 是 0xF000， 而 其 他 上 段 寄 和 存 问 都 是 0。 


re 一 EE Py — | 
和 车 Bochs for Windows - Console Ee ee 
aa ee 
Iololololololololo lo ] reset of ‘serial' plugin device by virtual method 
000000606001 [ ] reset of ‘gameport’ plugin device by virtual method 
] reset of ‘iodebug' plugin device by virtual method 
] set SIGINT handler to bx_debug_ctrlc_handler 











bochs, 1> sreg 
ss: 9x99096，dh=6x990693606，d1=0x90690ffff，ualid=7 
Data segment ，base=0x90000000，1lLinmit=:9x9o090ffff，Readyurite，hccessed 
cs :9xf9096，dhz0xff0093ff，d1-0x9000ffff，ualld=7 了 
Data Segment ，base=0xffff90090，1inmit:= i Read/lrite, Accessed 
ss:Qx0000, dh=Qx00800930609, dl=0QxQ000ffff, vallid: 
Data segment, base=QxOQ0000000, 1imit: Eee Readyurite，hccessed 
9x90096 ，dh=6x090093600，d1=0x90690ffff，ualid=7 
Data segment, base=QxQ0000000, limit=QxQQ00fFfff, Read/Write, Accessed 
ee :Ox0000, dh=0Qx000093060,，dl:=Qx0000ffff,， valid:=7 
Da segment, base=QxQ0000000, limit: et Read/Write, Accessed 
ee: OQx0000, dh=Qx000893060, dl=Qx8000ffff, valid 
Data segment, base=0QxQQ000000, limit: pO Read/lirite, Accessed 
dtr : OQx0000, dh=0Qx00008200, dl=QxQ0QQ0ffff, valid:1 
tr:Qx0000, dh=Qx00008b800, dl=QxQ000fFffF, valid:1 
gdtr:base=9x9909090606909099 ， limit=Qxffff 
ldtr:base=-QxQ0000000000000860，1imit=Qxffff 





<bochs:2> 


图 11-16 x86 处 理 器 加 电 后 的 段 寄存 器 状态 


图 中 还 显示 了 段 寄 存 堪 摘 述 符 高 速 缓存 需 的 内 容 ， 这 些 内 容 也 是 加 
电 之 后 预 置 的 。 首 先 ,， “dhm 是 段 描述 符 的 高 32 位 ;“d" 是 段 描述 符 的 低 32 
位 。 因 为 是 加 电 预 置 的 内 容 ， 并 非 来 目 于 拉 述 符 表 ， 所 以 ，“dh2 和 ?dl 的 
内 容 是 Bochs 根据 段 寄 存 器 描述 符 高 速 缓存 器 的 内 容 构造 的 。 


与 此 同时 ，Bochs 还 根据 各 个 段 寄 存 左 摘 述 符 高 速 缓存 磊 的 内 容 ， 
给 出 了 摘要 信息 。 其 中 , “Data segment ”表示 该 段 是 数据 段 ;“base” 
示 段 的 基地 址 ;“ limit ”指示 上段 的 界限 ;“Read/Write” 表 示 上 段 可 读 可 


好 依 


写 ;“Accessed” 指 示 段 曾经 被 访问 过 。 


8086 处 理 器 访问 内 存 时 ， 是 把 16 位 段 寄 存 器 的 内 容 左 移 4 位 ， 加 上 
16 位 偏 移 地 址 ， 比 如 


mov azx, LOx0O6] 


在 32 位 处 理 规 上 ， 每 次 回 段 寄存 需 传 送 逸 辑 段 节 址 时 ， 处 理 硕 即 在 
段 寄 和 存 右 手 述 从 珊 速 缓存 此 中 存放 一 个 左 移 后 的 20 位 基地 址 。 一 个 典型 
的 例子 十 


mov ds,ax 


因此 ， 即 使 在 实 模式 下 ， 处 理 器 也 是 用 段 寄 存 器 描述 符 高 速 缓存 器 
的 32 位 基地 址 加 上 16 位 偏 移 地 址 访问 内 存 ， 只 不 过 基地 址 的 高 12 位 通 
第 是 0。 当 然 ， 也 有 一 个 例外 ， 那 束 是 在 处 理 器 刚 电 加 时 ，CS 段 摘 述 符 
高 速 缓存 器 中 的 基地 址 被 预 置 为 0xFFFF0000， 这 使 得 处 理 器 取 第 一 条 指 
令 时 ， 地 址 线 的 高 位 部 分 被 强制 为 “1”。 又 因为 加 电 后 ，EIP 的 预 置 内 容 
是 0X0000FFF0O ， 故 ， 处 理 需 第 一 次 取 指 令 时 发 出 的 地 址 是 
0xFFFFFFF0O0。 之 所 以 这 样 做 ， 是 因为 处 理 正 的 说 计 者 布 望 把 ROM- 
BIOS 放 到 4GB 可 寻 址 内 存 范 围 的 最 高 端 ， 这 样 ，4GB 以 下 ， 连 同 传统 
的 低 端 1MB 都 是 连续 的 RAM 区 ， 连 续 的 、 不 间断 的 RAM 能 为 操作 系统 
常理 内 存 训 来 方便 。 

问题 在 于 ， 计 算 机 制造 商 们 会 考虑 很 多 现实 问题 。 老 的 硬件 和 软件 
依赖 于 低 问 1MB 的 ROMBIOS 来 工作 ， 这 涉及 到 兼容 性 。 最 终 ， 这 两 个 
地 址 区 上 段 都 指 问 同一 块 ROM 心 族 。 


从 图 中 可 以 看 到 ， 即 将 执行 的 第 一 条 指令 是 jmp far f000:e05b (jmp 
0xf000:0xe05b ) 。 当 这 条 指令 执行 后 ， 处 理 右 用 0xF000 的 值 左 移 4 
位 ， 存 放 到 上 段 寄 存 右 描述 从 高 速 缓存 右 。 于 是 ， 处 理 右 地 址 线 的 高 位 部 
分 不 再 为 “1”"， 这 又 转 到 低地 址 端的 BIOS 执行 了 。 如 图 11-17 所 示 ， 当 执 
行 远 转移 指令 后 ，CS 摘 述 符 高 速 缓存 器 中 的 基地 址 变 为 0x000F0000， 
下 一 条 指令 xor ax,ax 的 物理 地 址 是 0x000FE05B。 


3 Bochs for Windows - Console 


tr:OQx0000, dh=Qx0Q0008b00, dl:=:QxQ0Q0QOFfFfFfFf, valid:1 
gdtr:base:QxQ000000000000000，1imit=Qxffff 
idtr:base=<QxQ000000000000000，1imit=OQxffff 

<bochs:2> s 

Next at tz=1 

(0)j [96x900000000009feg95b ] f600 :eg05b (unk. ctxt)j: xor ax， 


IK<bochs:3> sreg 
es:09x99996，dh=0x000093006，d1:0x0009ffff，uUalld=7 了 

Data Segment ，base-0x000000696，1Limit=0xooooffff ，Readyurite，hccessed 
cs : 9xf060， dh=Qx0000930f, dl=Qx0000ffff, valid:1 


1 = 
Data segment, base=-QxQ00fF0000, limit=QxOQOQ00FffFfF, Read/lrite, Accessed 
ss:0x0000, dh=Qx00009300, dl=Qx0000Fffff, vallid:=7 
Data segment, base=:QxQ0000000, limit=QxQO00Q0FfFfFfFf, Read/Write, Accessed 
ds:0x00600, dh=:0x000609300, dl=QxQ000fFfFFF, valid:=7 
Data segment, base=:QxQQ0000000, limit=QxQQ00FfFff, Read/Write, Accessed 
fs:0x0000, dh=Qx000093060,，dl:=Qx0Q000ffff,， valid:=7 
Data Segment ，base:0x000000606，1Limit:9xooogoffff，Readyurite，hccessed 
M9s :0x0000, dh=0x0000930906，d1=0x0000ffff ，uUalldz=7 
Data segment ，base-0x00000060，1Limitz0x00009ffff ，Readyurite，hccessed 
ldtr:9x9000，dhz0x90008200，d1:0x9009ffff ，uvalldz=1 
tr:Qx0000, dh=Qx00008b00, dl=QxOQ000fFffFf, valid:1 
gdtr:base=-QxQQ000000000000000,，11imit=Qxffff 
idtr:base=-QxQ000000000000000，1imit=Qxffff 








- 


令 后 的 段 寄存 器 内 容 





图 11-17 ”处 理 器 加 电 并 执行 第 一 个 远 转移 指 


图 中 还 显示 了 全 局 描述 符 表 寄存 器 GDTR 的 内 容 。 很 显然 ，GDT 的 
基地 址 是 0， 表 界限 是 0xFFFF。 

注意 ， 在 进入 主 引 导 程 序 时 ， 这 些 段 寄存 器 的 内 容 (包括 GDTR) 和 
处 理 喜 刚 加 电 时 不 再 相同 。 原 因 很 简单 ，BIOS 的 加 电 目 检 程 序 在 执行 期 
间 要 进入 保护 模式 进行 测试 ， 这 将 改变 相关 段 寄 存 器 的 内 容 。 


11.9.3 ”设置 PE 位 后 的 段 寄存 器 状态 


一 旦 设置 了 控制 寄存 器 CR0 的 PE 位 ， 处 理 器 就 进入 了 保护 模式 。 
但 是 ， 除 非 我 们 主动 刷新 段 寄 存 器 的 内 容 ， 和 否则 ， 段 寄存 器 依然 保持 实 
模式 下 的 内 容 不 变 。 这 就 是 说 ， 设 置 了 PE 位 之 后 ， 刚 进入 保护 模式 时 的 
段 守 存 右 内 容 ， 束 是 实 模式 下 的 段 寄 存 右 内 容 。 

如 图 11-18 所 示 ， 我 们 在 执行 mov cr0,eax 指令 之 后 立即 显示 各 个 有 段 
寄存 器 的 内 容 。 实 际 上 ， 尽 管 进入 了 保护 模式 ， 但 显示 的 依然 是 实 模 式 
的 内 容 。 

从 图 中 可 以 看 出 ， 代 码 段 寄存 器 CS 描述 符 高 速 绥 存 器 的 dh 为 
0x00009300 ， 即 ， G=0 ，D=0 ，L=0 ，P=1 ，DPL=00 ，S=1， 
TYPE=0011。 通 俗 地 说 ， 这 是 一 个 粒度 为 字 节 的 数据 段 。 在 实 模式 下 ， 
这 些 属 性 信息 是 没有 作用 的 ， 定 义 成 数据 段 也 无 所 谓 。 

一 旦 设置 了 CR0 寄存 器 的 PE 位 ， 进 入 了 保护 模式 ， 那 么 ， 理 论 
上 ， 这 些 属性 信息 就 变 得 有 用 了 ， 有 意义 了 ， 但 同时 也 是 无 效 的 。 原 因 





在 于 ， 它 应 当 是 一 个 代码 段 ， 而 不 是 数据 段 ， 
四 3 Bochs for Windows console 0 


Next at t:17825058 
(9) [0x9000000000007c731] 0009:7c73 (unk.， ctxt): mou crgo，eax 
co 
《bochs:29> s 
Next at t=17825059 
(0) [0x9000000600097c76] 0000:0000000000007c76 (unk. ctxt): jmp far 0008:0000007 
a -lol0l0lololot:1olo 
<bochs:30> sreg 
es:Oxo0o000 ， a gx90009300，d1=0xoo000ffff ，ualildz1 
Data Segment ，base=0x696090000006，1imlit:0xoo000ffff，Readyuyrite，hccessed 
S:0Oxoo000， 和 gx00009300 ，d1=0xoo0o00ffff ，ualld=7 
Data segment ，base=0x900000006，1imit=0xoo00ffff，Readyurite，hccessed 
:OQx0Q000,， dh=0x00009300, dl:=:QxQQ00ffff, valid:1 
Data segment, base=QxOQQ0000000, limit=QxQO0Q00fFfFfFFf, Read/Write, Accessed 
ds:Oxoreog，dh:6oxo00009300 ，d1=0xreo0offff ，ualldz7 
Data segment ，base=0x9000re006，11imlit=0xooooffff，Readyurite，hccessed 
fs:0xoo00，dh=0x090009300，d1=0xoo000ffff ，ualldz1 
Data Segment ，base=0x900000006，1imit:Oxoogooffff，Readyurite，hccessed 
Mas:0x0000, dh=0x00009300, dl=0QxQQQ0fFfFfFf, valid:1 
Data segment, base=0Qx00000000, limit=QxOQ000fFfff, Read/lWrite, Accessed 
Mldtr :0x0000, dh=OQx00008200,， dl:=:QxQ000ffff,. valid:1 
tr:O0xoo900，dh=0x90008b09，d1:0xo9000ffff ，ualldz1 
gqdtr :base=QxQ000000000007e00, limit=Qxi1f 
-dolololoTololololollololo loo lo 全 站 
ccpsi31y 


图 11-18 ” 刚 进 入 你 护 柑 式 时 的 段 寄 存 右 状态 


官 如 此 ， 这 对 处 理 右 继续 取 指 令 和 执行 指令 没有 影 啊 。 原 因 是 ， 
在 保护 模式 下 对 描述 符 有 效 与 否 的 检查 ， 通 间 只 es 
择 厅 ) ， 并 刷新 朱 述 符 高 速 组 存货 的 时 候 进 ， 对 代码 段 来 说 ， 典型 的 
例子 是 远 下 转移 或 者 远 过 程 调 用 ， 比 如 











而 对 于 数据 段 来 说 ， 典 型 的 例子 是 加 载 段 选择 子 ， 比 如 


mov ds,ax 


当 这 类 指令 执行 时 ， 处 理 退 用 指令 中 给 出 的 选择 子 找到 拍 述 从 ， 如 
朱 搞 述 符 有 效 ， 就 将 选择 子 加 载 到 段 寄存 器 (选择 番 ) ， 并 把 搓 述 符 加 
载 到 描述 符 高 速 缓存 项。 因此 ， 一 个 不 合格 的 、 无 效 的 朱 述 符 不 可 能 衫 
Ee 的 描述 符 高 速 绥 存 器 ， 不 过 ， 妆 前 这 个 情况 比较 特殊 ， 
因为 它 是 进入 你 护 模 式 前 遗留 下 来 的 。 


11.9.4 ”JMP 指令 执行 后 的 段 寄 存 器 状态 


x86 处 理 器 的 保护 模式 分 为 两 种 : 16 位 保护 模式 和 32 位 保护 模式 。 
处 理 器 加 电 、 设 置 CR0 寄 存 器 的 PE 位 后 ，CS 描述 符 高 速 缓存 器 中 的 D 


位 古 0， 处 理 占 根据 此 位 将 上 日 己 的 状态 设置 为 16 位 保护 柑 式 。 


16 位 你 护 模 式 和 实 模 式 相 比 ， 在 指令 格式 和 寻 址 方式 上 是 相同 的 。 
因此 ， 如 果 进 入 你 护 模 式 后 的 指令 是 16 位 指令 ， 从 理论 上 来 说 不 会 有 什 
么 问题 。 实 际 上 ， 因 为 各 个 段 寄 和 存 奋 ， 特 别 是 数据 段 守 和 存世 中 的 内 容 并 
没有 更新 ， 不 适当 的 内 存 访 问 将 导致 不 可 预知 的 问题 。 


以 上 所 说 ， 是 解释 为 什么 进入 保护 模式 后 ， 人 处理 如 还 能 接着 往 下 执 

J 的 原因 。 问 题 在 于 ， 它 虽然 还 能 按 原 来 的 执行 流程 进行 ， 但 后 面 的 代 

码 是 用 bits 32 编译 的 。 当 处 理 嚣 处 在 16 位 保护 模式 时 ， 它 会 按 16 位 的 
方式 译 码 32 位 指令 ， 这 是 不 行 的 。 


因此 ， 我 们 使 用 了 jmp dword 0x0008:flush 指令 。 这 是 一 个 默认 地 用 
bits 16 编译 ， 在 16 位 模式 下 译 码 ， 但 要 求 按 32 位 执行 的 指令， 所 以 ， 
必然 具有 有 反 转 操作 数 大 小 的 前 级 0x66。 


3 Bochs for Wi rs Consol 


(0) [OQx0000000000007c76] 0000 : 600060006000007c76 (unk . mr Jmp far O0008: 00600007 加 
; 6beare0000000860 


[9x96600600660069rcre] 96060608:900600606066006re (unk. ctxt): mou cx, Ox0010 
; E68b91000 

| 
es:0x90096，dhz0x090600936060，d1:6x0000ffff ，ualidz1 

Data segment, base=<Qx00000000, limit=QxOQ00ffff, Read/Write, Accessed 
cs:0x0008, dh=Ox00409900,， dl=Qx?7cO001ff, valid:1 

Code gm i e=QxQ0007c00, limit=<OQxQ00001ff, Execute-Only, Non-Confo 
jk Accessed, 32- 

:90x000096，dh: ti dl1:90x00900ffff ，ualidz1 

Data segment, base=QxQ0000000, limit=QxQQ0QOfFfFff, Read/Write, Accessed 
ds :OQx07e0, ne Ox000093060，dl=Qx?eQQffff, valid:=7 

Data segment, base=QxQ0007e00, limit: Read/lIrite, Accessed 
fs:0Qx0000, 二 9x006909300，d1:0x09000ffff，ualid: 

Data Segment ，base=0x900600606，1imit:= sea Readyurite，hccessed 
gs:0x900996，dh:90x00609360，d1=0x9000ffff，uvalldz1 

Data segment ，base=0x90000006，1lLimit:0xooooffff，Readyurite，hccessed 
ldtr:9x9900，dh=0x990082006，d1:0x9009ffff，ualldz=1 
tr :90x00096，dh:0x009608b90，d1:0x0000ffff，Ualldz=1 
[sd tTob dololololololo lololololo rT 
Pe oT- Eb 010lololololololololo [olo lo lo To 
<bochs:16> 


图 11-19 ”执行 JMP 指令 后 的 段 寄存 器 内 容 





如 图 11-19 所 示 ， 这 条 et EA 7E 00 00 00 08 
00， 在 它 执 行 后 ， 我 们 叉 一 次 显示 了 有 臣 寄 存 右 的 状态 。 从 图 中 可 以 看 
Hi 奇人 CS 及 有 he ton hho hid 此 
后 ， 处 理 器 根据 描述 符 高 速 组 存 器 的 D 位 《此 时 为 “1”) ， 把 自己 设置 为 
32 位 模式 。 


11.9.5 ”察看 全 局 描述 符 表 GDT 


可 以 察看 全 局 描述 符 表 的 内 容 ， 但 前 提 是 必须 加 载 了 全 局 描述 符 表 
寡人 存 左 GDTR 才 行 ， 因 为 Bochs 要 先 访问 GDTR 取得 GDT 的 基地 址 和 有 者 
限 信息 。 

如 图 11-20 所 示 ， 单 步 执行 本 草 的 程序 ， 在 执行 指令 Igdt [cs: 
gdt_size+0x7c00] 后 停 下 来 ， 输 入 “info gdt" 命 令 ， 来 显示 GDTR 的 内 容 。 


| 鲍 gochs for Windows - consoe 量 2 | [Eo 15) Sem| 


(9] [6xo0000000090007c501] 6000:7 了 c50 (unk.， ctxt]: mou dword kr ds: [bx+28],， OxQ040m 
; 66cr1471c009614000 





Next st t= 17825050 
(9) [96x0966000600060060097c58] L010 TOA 
2ec7060ard1f00 





Next at t:17825051 
[0) [0x00060000006000rcsf] 0000:7cSsf (unk，ctxt): 1gdt cs:0xrdg0a 


Next at t=17825052 
(0) [90x9000000000607c65] 0000:7c65 (unk. ctxt): in al, Ox92 


<bochs:22> info gdt 

Global Descriptor Table (base=<OQx0Q000000000007e00, limit:=31): 

GDT[Ox00]:=:??? descriptor hi=Qx00000000，10=Qx090000000 

GDT[Oxo1]:Ccode segment ，base:0x9000rcoo，11mlt=0Oxoo9o0001ff，Execute-0nly，Non-Ccon 


forming, 32-bit 

GDT[OQx02]:Data segment, base=:QxQ00b8000, limit:=QxQ000fFfff, Read/Write 
GDT[OQx03]=:Data segment, base=QxQ0000000, limit=Qx00007a00, Read/lJrite, Expand-do 
Wn 

You can list individual entries with ‘info gdt [NUM]' or groups with ‘info gdt [ 民 
NUM] [NUM] 








<bochs :23> 





图 11-20 ”察看 全 局 描述 符 表 GDT 的 内 容 


如 图 中 所 示 ，Bochs 给 出 了 每 个 描述 符 的 索引 和 相关 信息 。 比 如 ， 
它 用 "GDT[0x01] 表示 GDT 的 1 扎 槽 位 ;“Code segment" 表 示 代 人 码 鼎 ; 
“base" 表 示 段 的 32 位 其 地址 ;“limi 表 示 段 界限 值 ;“Execute-Only” 表 示 
只 执行 ;“Non-Conforming”" 表 示 非 依从 的 ;“32-bit" 表 示 这 是 一 个 32 位 的 
段 。 


11.9.6 察看 控制 寄存 占 的 内 容 


本 章 在 进入 休 护 模式 前 ， 需 要 设置 控制 寄存 瞩 CR 的 PE 位 。 在 往 
后 的 学 习 过 程 中 ， 有 可 能 要 察看 控制 守 存 此 的 状态 ， 这 里 简单 做 一 下 介 


绍 。 





Next at t:17825055 

[6] [69x96699666666667c6b] 6666:7c6b (unk. ctxt): cli ; fa 
<bochs:25> 

Next at t:17825056 

(96)j [6x900606000669097c6c] 00606:7c6c (unk. ctxt]j: mou eax，cre 





ctxt): or eax, OxQ0Q0000001 


Ne 595 
(9) [ex te 73] 0000:7c73 (unk. ctxt): mou cr eax 
co 


<bochs:28> creg 
CRO=:Qx680000010: pg CD ac wp ET em mp pe 
CR2:=:page fault laddr:0Qx rt 
CR3=0xQ000880000098080009 

= 国 











图 11-21 察看 控制 寄存 器 的 内 容 


如 图 11-21 所 示 ， 可 以 用 命令 “creg”(control register) 来 察看 控制 

如 和 仔 人 的 内 容 。32 位 处 理 器 有 多 个 控制 寄存 大 ， 不 单单 是 CR0。 所 以 ， 

它 会 显示 所 有 控制 襟 存 右 的 内 容 。 如 图 中 所 示 ， CRO0 的 内 容 是 
0x60000010， 为 了 方便 起 见 ，Bochs 给 出 了 各 个 控制 位 的 状态 ， 小 写 表 
示 该 位 是 "0"， 大 写 表 示 该 位 是 “人 ”， 即 处 于 置 位 状态 。 显 然 ， 此 时 PE 位 
是 “0"， 处 理 需 并 未 工作 在 保护 模 陈 下 ， 这 是 因为 指令 mov cr0,eax 指令 
还 没有 执行 。 至 于 其 他 控制 寄存 需 ， 以 及 CRO 其 他 各 控制 位 的 含义 ， 各 
们 将 在 后 面 慢 慢 接触 ， 这 里 不 用 理会 。 


本 章 习 题 


在 我 的 计算 机 上 ， 创 建 虚 拟 机 时 指定 的 内 存 容 量 是 64MB。 因 此 ， 实 
际 有 效 的 物理 地 址 范围 是 0x00000000 一 0x03FFFFFF。 我 发 现 ， 如 果 将 
代码 清单 11-1 的 第 79 行 改 成 以 下 指令 ， 程 序 工作 正常 ， 能 显示 句点 : 


mov esp,O0x04000003 
但 是 ， 如 末 改 成 


mov esp, 0x04000004 


束 个 能 显示 句 扣 。 请 问 这 是 什么 原因 。 注 意 ， 处 理 如 在 访问 内 存 时 ， 并 
个 检验 内 存单 元 的 有 效 性 。 


第 12 间 ”存储 右 的 保护 


处 理 占 引入 保护 模式 的 目的 是 近 供 保护 功能 ， 其 中 很 重要 的 一 个 方 
面 束 是 和 存储 右 你 护 。 和 存储 卓 的 保护 功能 可 以 论 止 程序 的 非法 内 存 访问 ， 
比如 ， 回 代码 段 号 入 数据 、 访 问 段 界 限 之 外 的 内 存 位 置 等 。 很 多 时 候 ， 
这 类 问题 部 是 由 于 编程 殉 漏 引起 的 ， 属 于 有 人 缺陷 的 软件 ， 但 也 不 排除 软 
件 的 功能 本 喘 就 是 恶意 的 。 不 过 ， 一旦 能 够 及 时 发 现 和 禁止 这 些 非 法 操 
作 ， 在 程序 失去 控制 之 前 引 友和 弄 单 中 断 ， 束 可 以 提 融 软件 的 可 徘 性 ， 降 
低 整 个 计算 机 系统 的 安全 风险 。 


凡事 都 有 两 面 。 利 用 存储 融 的 保护 功能 ， 也 可 以 实现 一 些 有 价值 的 
功能 ， 比 如 虚拟 内 存 管理 。 当 处 理 吉 访问 一 个 实际 上 不 存在 的 段 时 ， 会 
引 有 友 有 开 币 中断。 操作 系统 可 以 利用 这 一 点 ， 通 过 接 宫 天 向 处 理 过 程 ， 并 
用 便 盘 来 进行 段 的 换 入 和 换 出 ， 从 而 实现 在 较 小 的 内 存 空间 运行 尽 可 能 
大 、 尽 可 能 多 的 程序 。 本 章 的 学 习 目 标 是 : 


1. 通过 实例 来 认识 处 理 右 是 如 何 进 行 存 储 帮 的 保护 的 。 
2. 了 解 列 名 段 的 意义 和 作用 。 


3. 以 一 个 字符 串 排 序 过 程 作为 例子 ， 演 示 保 护 模 式 下 的 内 存 数 据 访 
问 ， 体 验 一 下 它们 与 在 实 模 式 下 访问 数据 段 有 什么 不 同 。 同 时 ， 在 这 个 
过 程 中 学 习 用 汇编 语言 实现 冒 泡 排 序 算法 ， 以 及 一 条 新 的 X86 处 理 絮 指 
令 xchg。 


12.1 ”代码 清单 12-1 





12.2 ”进入 32 位 保护 模式 


12.2.1 话说 mov ds,ax 和 mov ds,eax 


本 章 的 代码 和 上 一 革 有 几 分 类 似 ， 但 实质 上 有 很 大 区 列 。 
我 们 知道 ， 段 寄存 散 〈 选 择 夯 ) 的 值 只 能 用 内 存单 元 或 者 通用 寄存 
做 来 传送 ， 一 般 的 指令 格 陈 为 
mov sreg,r/ml6 
这 里 有 一 个 常见 的 例子 : 


在 16 位 模式 下 ， 传 送 到 DS 中 的 值 是 逻辑 段 地 址 ， 在 32 位 保护 模式 
下 ， 传 送 的 是 段 摘 述 符 的 选择 子 。 无 论 传送 的 是 什么 ， 这 都 不 重要 ， 主 
要 的 是 ， 在 16 位 模式 和 32 位 模式 下 ， 一 些 老式 的 编译 器 会 生成 不 同 的 机 
右 代 但 。 下 面 是 一 个 例证 : 


I51ita G8] 

mov ds,ax ; BE De 
[Bits 32| 

mov ds,ax ;66 8E D8 


由 于 在 16 位 模式 下 ， 默 认 的 操作 数 大 小 是 字 (2 字 节 ) ， 故 生成 8E 
D8 也 不 难 理解 。 在 32 位 模式 下 ， 默 认 的 操作 数 大 小 是 双 字 (4 字 节 ) 。 
由 于 指令 中 的 源 操作 数 是 16 位 的 AX， 故 编译 后 的 机 器 人 码 前 面 应 当 添 加 前 
级 0x66 以 肥 转 默认 的 操作 数 大 小 ， 即 66 8E D8。 


在 执行 时 会 多 人 花 一 个 额外 的 时 钟 周 期 。 问 题 在 于 ， 这 样 的 指令 用 得 很 频 
尝 ， 而 且 罕 扯 到 内 存 段 的 访问 ， 目 然 也 很 重要 。 因 此 ， 它 们 在 16 位 模式 
和 32 位 柑 式 下 的 机 右 指 令 锌 设计 为 相同 。 即 部 是 8E D8， 不 需要 指令 前 


又 又 
组 O 


这 可 难 倒 了 很 多 编 详 副 ， 它 们 固执 地 认为 ， 在 32 位 模式 下 ， 源 操作 
数 是 16 位 的 寄存 桌 AX 时 ， 应 当 添 加 指令 前 级 。 好 吧 ， 为 了 照顾 它们 ， 很 
多 程序 员 习 惯 使 用 这 种 看 起 来 有 点 列 扭 的 形式 : 


mov ds,eax 
你 列 说， 还 真有 效 ， 果 然 生 成 的 是 不 加 前 级 的 8E D8。 
说 到 这 里 ， 我 党 得 NASM 纺 详 项 还 是 非 负 优秀 的 ， 起 但 它 不 会 有 这 
样 的 问题 。 因 此 ， 不 管 处 理 磺 模式 如 何 变化 ， 也 不 壹 指令 形式 如 何 变 
化 ， 以 下 代码 编译 后 的 结果 部 一 模 一 样 : 


[bits 1€] 
mov ds ax 78E D3 
mov ds,eax -SE D8 
[ES 321 
mov ds,ax ;BE D8 
mov ds,eax ;8E D8 


和 这 个 示例 一 样 ， 其 他 从 通用 寄存 器 到 段 寄 存 器 的 传送 也 符合 这 样 
的 编译 规则 。 因 此 ， 代 码 清单 12-1 第 7、8 行 ， 用 于 通过 寄存 器 EAX 来 
初始 化 栈 段 寄存 器 SS。 


12.2.2 ”创建 GDT 并 安装 段 描 述 符 


准备 进入 保护 模式 。 

自 和 完 是 创建 GDT， 并 和 安装 刚 进入 保护 模式 时 就 要 使 用 的 拉 述 付 。 第 
12 一 15 行 ， 首 先 计算 GDT 在 实 模式 下 的 饮 辑 地 址 。 在 上 一 章 里 ，GDT 
的 大 小 和 线性 基地 址 分 别 是 用 两 个 标号 gdt_size 和 gdt_base 声明 和 初始 
化 的 : 


gat S12e GWw'0 
gdt base Gad OXO000000 7e0D 


但 是 ， 如 后 面 的 第 107、108 行 所 示 ， 现 在 已 经 改 成 


pdgt dw 0 
dd Ox00007e00 


另外 一 个 区 别 是 计算 GDT 逻辑 地 址 的 方法 。 在 32 位 处 理 絮 上 ， 即 使 
征 在 实 模式 下 ， 世 可 以 使 用 32 位 寄存 项 。 所 以 ， 第 12 行 ， 生 接 将 GDT 
的 32 位 线性 基地 址 传送 到 和 寄存 砸 EAX 中 。 


我 们 知道 ，32 位 处 理 颖 可 以 执行 以 下 除法 操作 : 
diy T/m32 


其 中 ，64 位 的 被 除数 在 EDX:EAX 中 ，32 位 被 除数 可 以 在 32 位 通用 
寄存 器 中 ， 也 可 以 在 32 位 内 存单 元 中 。 因 此 ， 第 13 一 15 行 ， 用 64 位 的 
被 除数 EDX:EAX 除 以 32 位 的 除数 EBX。 指 令 执行 后 ，EAX 中 的 商 是 段 
地 址 ， 仅 低 16 位 有 有效 ; EDX 中 的 余数 是 段 内 侦 移 地 址 ， 仅 低 16 位 有 
效 。 

第 17、18 行 ， 初 始 化 段 寄存 器 DS， 使 其 指向 GDT 所 在 的 逻辑 段 。 

第 21、22 行 ， 安 装 空 描述 符 。 该 描述 符 的 模 位 号 是 0， 处 理 器 不 允 
许 访问 这 个 摘 述 符 ， 任 何 时 候 ， 使 用 索引 字段 为 0 的 选择 子 来 访问 该 摘 述 
符 ， 都 会 被 处 理 需 阻止 ， 并 引发 录 利 中断 。 在 现实 中 ， 一 个 筷 了 初始 化 
的 指针 往往 默认 值 就 是 0， 所 以 空 描述 符 的 用 意 就 是 阻止 不 安全 的 访问 。 
很 多 人 喜欢 用 这 个 模 位 来 记载 一 些 私 人 信息 ， 做 一 些 特殊 的 用 途 ， 认 为 
反正 处 理 器 也 不 用 它 。 但 是 ， 这 样 做 可 能 是 不 安全 的 ， 还 没有 证 据 表 明 
Intel 公司 保证 决 不 会 使 用 这 个 横 位 。 

第 25、26 行 ， 安 装 保 护 模式 下 的 数据 段 摘 述 符 。 参 考 前 面 的 段 描述 
符 格 式 ， 可 以 看 出 ， 该 段 的 线性 基地 址 位 于 整个 内 存 的 最 低 端 ， 为 
0x00000000; 属于 32 位 的 段 ， 段 界限 是 0xFFFFF 。 但 是 要 注意 ， 段 的 
粒度 是 以 4KB 为 单位 的 。 对 于 以 4KB 〈 十 进 制 数 4096 或 者 十 六 进 制 数 
0x1000) 为 粒度 的 段 ， 描 述 符 中 的 界限 值 加 1， 吏 是 访 段 有 多 少 个 4KB。 
因此 ， 其 实际 使 用 的 段 界 限 为 


(描述 符 中 的 段 界限 值 十 1) X0x1000 一 1 
将 其 展开 后 ， 即 


描述 符 中 的 段 界限 值 X0x1000 十 0x1000 一 1 


因此 ， 在 换算 成 实际 使 用 的 段 界 限时 ， 其 公式 为 
描述 符 中 的 段 界限 值 X 0x1000 十 0xFFF 

这 就 是 说 ， 实 际 使 用 的 段 界 限 是 
OXFFFFFX 0x1000+0xFFF=0xFFFFFFFF 


也 就 是 4GB。 束 32 位 处 理 器 来 说 ， 这 个 地 址 范围 已 经 最 大 了 。 一 旦 使 用 
这 个 段 ， 束 可 以 访问 0 到 4GB 空间 内 的 任意 一 个 单元 ， 这 是 本 书 开篇 以 
来 ， 从 来 没有 过 的 事情 。 

第 29、30 行 ， 安 装 保 护 模式 下 的 代码 段 描述 符 。 该 段 是 32 位 的 代 
僻 ， 线 性 基地 址 为 0x00007C00; 段 界 限 为 0x001FF， 粒 度 为 字 节 。 对 于 
向 上 扩展 的 段 来 说 ， 段 界限 在 数值 上 等 于 段 的 长 度 减 去 1， 因 此 该 段 的 长 
度 是 0x200， 即 512 字 节 。 


根据 上 一 章 的 经 验 ， 该 段 实 际 上 就 是 当前 程序 所 在 的 段 〈 正 在 安装 
该 描述 符 呢 ) ， 也 束 是 主 引 导 程 序 所 在 的 区 域 。 尽 管 在 描述 符 中 把 它 定 
义 成 32 位 的 段 ， 但 它 实 际 上 既 包 含 16 位 代码 ， 也 包含 32 位 代码 。[bits 
32] 之 前 的 代码 是 16 位 的 ， 之 后 的 代码 是 32 位 的 。 不 过 ， 在 该 摘 述 符 生 
效 的 时 候 ， 处 理 器 的 执行 流 已 经 位 于 32 位 代码 中 了 。 

第 33、34 行 ， 安 装 保 护 模式 下 的 数据 段 描 述 符 。 该 段 是 32 位 的 数 
据 段 ， 线 性 基地 址 为 0x00007C00; 上 段 界限 为 0x001FF， 粒 度 为 字 节 。 可 
以 看 出 ， 该 摘 述 符 和 前 面 的 代码 段 摘 述 符 ， 描 述 和 指 同 的 是 同一 个 段 。 
你 可 能 很 想 知道 ， 这 样 做 的 用 意 何在 ? 

参见 上 一 章 的 表 11-1， 我 们 都 已 经 知道 ， 在 保护 模式 下 ， 代 码 段 是 
不 可 写 入 的 。 所 谓 不 可 写 入 ， 并 非 是 说 改变 了 内 存 的 物理 性 质 ， 使 得 内 
存 写 不 进去 ， 而 是 说 ， 通 过 该 段 的 插 述 符 来 访问 这 个 区 域 时 ， 人 处 理 器 不 
允许 回 里 面 写 入 数据 或 者 更 改 数据 。 

但 是 ， 很 多 时 候 ， 又 需要 对 代码 段 做 一 些 修改 。 比 如 在 调试 程序 
时 ， 需 要 加 入 断 点 指令 int3。 不 管 怎么 样 ， 如 果 需 要 访问 代码 段 内 的 数 
据 ， 只 能 重新 为 该 段 安 装 一 个 新 的 描述 符 ， 并 将 其 定义 为 可 读 可 写 的 数 
据 段 。 这 样 ， 当 需要 修改 代码 段 内 的 数据 时 ， 可 以 通过 这 个 新 的 摘 述 符 
来 进行 。 


像 这 样 ， 当 两 个 以 上 的 描述 ~ 总 
从 都 插 述 和 指 问 同一 个 段 时 ， 把 


另外 的 描述 符 称 为 别名 tem 
(Calias) 。 注 意 ， 别 名 技术 并 非 32 位 ，4KB 粒 度 
仅仅 用 于 读 写 代码 段 ， 如 果 两 个 “oooorsz。 | 各 
程序 想 共 享 同一 个 内 存 区 域 ， 可 基 址 二 00007C00 
以 分 别 为 每 个 程序 都 创建 一 个 描 32 位 ， 宁 所 相 度 
述 符 ， 它们 都 指 问 同一 个 内 数据 段 ， 特 权 级 00 
存 段 ， 这 也 是 别名 应 用 的 例子 。 ”| 是 2000cn 

第 36、37 行 ， 安 装 保护 模式 390 学 半 粒 认 
下 的 栈 段 描述 符 。 该 段 的 线性 基 ， | 但 肛 特权 级 0 
地 址 是 0x00007C00 ， 段 界限 为 基 址 二 00000000 
0xFFFFE， 交 上 度 为 4KB。 a 和 


尽管 该 段 和 代码 段 使 用 同一 00007po@ | 区 条， 后 信 级 0 
个 线性 基地 址 ， 但 这 不 会 有 什么 
问题 ， 代 码 段 是 向 上 (高 地 址 方 
向 ) 扩展 的 ， 而 栈 段 是 向 下 ( 低 
地 址 方向 ) 扩展 的 。 至 于 段 界限 
为 0xFFFFE， 粒度 为 4KB， 我 知 

道 你 可 能 会 有 某 些 疑问 ， 这 些 事 主 引导 程序 


情 号 上 束 会 讲 到 。 


第 40 行 ， 设 置 GDT 的 界限 值 0%0007co0 
为 39， 因 为 这 里 共有 5 个 描述 
符 ， 总 大 小 为 40 字 节 ， 界 限 值 为 a 
39。 后 面 的 代码 用 于 进入 保护 模 
式 ， 差 不 多 和 上 一 章 相 同 ， 不 再 
袭 述 。GDT 和 GDT 内 的 描述 符 ， 
以 及 本 章程 序 ， 它 们 在 内 存 中 的 
映 象 如 图 12-1 所 示 。 





00007E000 


An > 


图 12-1 本 章程 序 中 各 个 部 分 在 内 存 中 的 上 映 象 


12.3 ”修改 段 寄 存 郁 时 的 你 护 


随 着 程序 的 执行 ， 经 和 常 要 对 上 段 寄 存 器 进行 修改 。 此 时 ， 人 处 理 占 在 变 
更 段 寄存 器 以 及 隐藏 的 描述 符 高 速 绥 存 器 的 内 容 时 ， 要 检查 其 代入 值 的 
| 

代码 清单 12-1 第 55 行 ， 这 是 一 条 直接 远 转移 指令 : 


Jmp dword OQx0010:figsh 


这 条 指令 会 隐 式 地 修改 段 寄 存 如 CS。 
同样 要 修改 段 寄 存 右 的 指令 还 出 现在 第 59 一 68 行 〈 以 下 粗 体 部 
分 ) : 


moVv eax, Ox0018 


mov ds,eax 


mov eax, 0x0008 ;加载 数据 段 (0 :4GB) 选择 子 
mov es,eax 
mov fs,eax 


MOV JS,eax 


io eax, OXO0020 ;0000 0000 0010 0000 


NOV SS,eax 


以 上 的 指令 涉及 所 有 段 寄 存 器 ， 当 这 些 指令 执行 时 ， 处 理 器 把 指令 
中 给 出 的 选择 子 传送 到 段 寄 存 器 的 选择 器 部 分 。 人 但是， 处理 器 的 固件 在 
完成 传送 之 前 ， 要 确认 选择 子 是 正确 的 ， 并 且 该 选择 子 选 择 的 描述 符 也 
是 正确 的 。 

在 当前 程序 中 ， 选 择 子 的 TI 位 都 是 0， 故 所 有 的 摘 述 符 都 在 GDT 
中 。 如 图 12-2 所 示 ，GDT 的 基地 址 和 界限 ， 都 在 寄存 器 GDTR 中 。 擂 述 
符 在 内 存 中 的 地 址 ， 是 用 索引 号 乘 以 8， 再 和 描述 符 表 的 线性 基地 址 相 加 
得 到 的 ， 而 这 个 地 址 必须 在 描述 符 表 的 地 址 范围 内 。 换 句 话 说 ， 款 引号 
乘 以 8 得 到 的 数值 ， 必 须 位 于 描述 符 表 的 边界 范围 之 内 。 换 名 话说， 处理 


器 从 GDT 中 取 某 个 描述 符 时 ， 束 要 求 描述 符 的 8 个 字 节 都 在 GDT 边界 之 
内 ， 也 就 是 索引 号 x8 十 7 小 于 等 于 边界 。 


An An 


GDT 


条 件 : 索引 号 X8 十 7 二 边界 | 


边界 基地 址 





图 12-2 ”有 系 引 号 的 检查 


如 末 检 查 到 指定 的 段 描述 符 ， 其 位 置 超 过 表 的 边界 时 ， 处 理 磺 中 下 
处 理 ， 产 生 开 音 中 断 13， 同时 段 寄 存 器 中 的 原 值 不 变 。 


以 上 仪 仪 是 检查 的 第 一 步 。 要 是 通过 了 上 述 检 查 ， 并 从 表 中 取得 描 
述 们 后 ， 紧 接 着 还 要 对 摘 述 符 的 类 别 进 行 确 认 。 举 个 例子 来 说 ， 知 描述 
符 的 类 别 是 只 执行 的 代码 段 〈 表 11-1) ， 则 不 允许 加 载 到 除 CS 之 外 的 其 
他 段 寄存 器 中 。 

具体 地 说 ， 首 先 ， 摘 述 符 的 类 别 字 段 必 须 是 有 效 的 值 ，0000 是 无 效 
值 的 一 个 例子 。 

然后 ， 检 和 奏 摘 述 符 的 类 别 是 否 和 段 寄 存 需 的 用 途 匹 配 。 其 规则 如 表 
12-1 所 示 。 


表 12-1 段 的 闫 别 检查 


代码 段 (X=1) 
We=1) 只 执行 (R=0) 执行 、 证 RE) 





最 后 ， 除 了 按 表 12-1 进行 段 的 类 别 检查 外 ， 还 要 检查 描述 符 中 的 P 
位 。 如 果 P 二 0， 表 明 虽 然 描述 符 已 被 定义 ， 但 该 段 实际 上 并 不 存在 于 物 
理 内 存 中 。 此 时 ， 处 理 器 中 止 处 理 ， 引 发 异常 中 断 11。 一 般 来 说 ， 应 当 
定义 一 个 中 断 处 理 程序 ， 把 该 描述 符 所 对 应 的 段 从 硬盘 等 外 部 存储 器 调 
入 内 存 ， 然 后 置 P 位 。 中 断 返 回 时 ， 处 理 器 将 再 次 尝试 刚才 的 操作 。 

如 果 P= 二 1， 则 处 理 器 将 描述 符 加 载 到 段 寄 存 器 的 描述 符 高 速 缓 存 
器 ， 同 时 置 A 位 〔〈 仅 限于 当前 讨论 的 存储 器 的 段 描述 符 ) 。 


注意 ， 如 表 中 所 指示 的 那样 ， 可 读 的 代码 段 关 似 于 ROM。 可 以 用 段 
超越 前 缀 “cs: "来 读 其 中 的 内 容 ， 也 可 以 将 它 的 描述 符 选 择 子 加 载 到 
DS、ES、FS、GS 来 做 为 数据 段 访问 。 代 码 段 在 任何 时 候 都 是 不 可 写 
的 。 


一 旦 上 述 规 则 全 部 验证 通过 ， 处 理 器 就 将 选择 子 加 载 到 段 宫 存 器 的 
选择 器。 显然 ， 只 有 可 以 写 入 的 数据 段 才能 加 载 到 SS 的 选择 顷 ，CS 寄 
存货 只 允许 加 载 代码 段 手 述 从 。 力 外 ， 对 于 DS、ES、FS 和 GS 的 选择 
船 ， 可 以 癌 其 加 载 数值 为 0 的 选择 子 ， 即 


OSCaxX eax ;eax = 0 


mov ds,eax SS 0 


尽管 在 加 载 的 时 候 不 会 有 任何 问题 ， 但 在 ， 真 正 要 用 来 访问 内 存 
时 ， 就 会 导致 一 个 异常 中 断 。 这 是 一 个 特殊 的 设计 ， 处 理 占 用 它 来 保证 
系统 安全 ， 这 在 后 面 会 讲 到 。 不 过 ， 对 于 CS 和 SS 的 选择 器 来 襄 ， 不 允 
许 问 其 传送 为 0 的 选择 子 。 

继续 回 到 代码 清单 12-1 中 来 ， 第 55 一 68 行 的 指令 执行 之 后 ， 段 寄存 
器 CS 指 癌 512 字 节 的 32 位 代码 段 ， 基 地 址 是 0x00007C00; DS 指 癌 512 
字 节 的 32 位 数据 段 ， 该 段 是 上 述 代 人 码 段 的 别名 ， 因 此 基地 址 也 是 
0x00007C00; ES、FS 和 GS 指 癌 同一 个 段 ， 该 段 是 一 个 4GB 的 32 位 


数据 段 ， 基 地 址 为 0x00000000; SS 指向 4KB 的 32 位 栈 段 ， 基 地 址 为 
0x00007C00。 


检测 点 12.1 
1. 若 某 段 描述 符 中 的 段 界 限 是 0xFFFFC， 当 粒度 为 字 节 和 4KB 
时 ， 实 际 使 用 的 段 界 限 是 多 少 ? 


2. 行 GDT 的 界限 为 0x87， 寄 存 器 AX 的 内 容 为 0x0088， 则 执行 指 
今 mov ds,ax 时 ， 处 理 器 会 产生 异常 吗 ? 


12.4 ”地 址 变换 时 的 保护 
12.4.1 ”代码 段 执行 时 的 保护 


在 32 位 模式 下 ， 尺 官 段 的 信息 在 插 述 得 表 中 ， 但 是 ， 一 旦 相应 的 插 
述 从 补 加 载 到 段 寄存 占有 的 搬 述 从 局 速 缓存 强 ， 则 人 处理 右 取 指令 和 执行 指 
令 时 ， 将 不 再 访问 接 述 从 表 ， 而 是 朋 接 使 用 上段 寄存 占有 的 插 述 从 局 速 绥 行 
髓 ， 从 中 取得 线性 基地 址 ， 同 指令 指针 寄存 右 EIP 的 内 容 相 加 ， 共 同形 
成 32 位 的 物理 地 址 从 内 存 中 取得 下 一 条 指令 。 不 过 ， 在 指令 实际 开始 执 
行 之 前 ， 处 理 器 必须 检验 其 存放 地 址 的 有 效 性 ， 以 防止 执行 超出 允许 范 
围 乙 外 的 指令 。 


每 个 代码 段 虱 有 目 己 的 段 界限 ， 位 于 其 拉 述 符 中 。 实 际 使 用 的 段 界 
限 ， 其 数值 和 粒度 (G) 位 有 天， 如 末 G 二 0， 实 际 使 用 的 段 界 限 束 是 接 
述 符 中 记载 的 段 界 限 ; 如 果 G 二 1， 则 实际 使 用 的 段 界限 为 


描述 符 中 的 段 界限 值 X 0x1000 十 0xFFF 


该 计算 公式 已 经 在 前 面 出 现 过 ， 不 再 解释 。 

代码 段 是 同上 【〔 蜗 地 址 方 铝 〉 扩展 的 ， 因 此 ， 实 际 使 用 的 段 界 限 就 
征 当 前 段 内 最 后 一 个 允许 访问 的 侦 移 地 址 。 当 处 理 礁 在 该 段 内 取 指 令 执 
行 时 ， 依 移 地 址 由 EIP 捉 供 。 指 令 很 有 可 能 是 路 越 边 弄 的 ， 一 部 分 在 边 
界 之 和 内， 一 部 分 在 边界 之 外 ， 或 者 一 条 单字 节 指 令 正 好 位 于 边界 上 。 因 
此 ， 要 执行 的 那 条 指令 ， 其 长 度 减 1 后 ， 与 EIP 寄存 左 的 值 相 加 ， 结 采 必 
须 小 于 等 于 实际 使 用 的 段 界 限 ， 人 奋 则 引 肥 人 处理 妖 异 第 。 即 : 


0 三 (EIP 十 指令 长 度 一 1) 三 实际 使 用 的 段 界限 


在 本 和 章 中 ， 人 代码 段 描述 符 中 给 出 的 界限 值 是 0x001FF ， 粒 度 是 字 
三， 可 以 认为 它 就 是 段 内 了 最 后 一 个 允许 访问 的 偏 移 地 址 。 如 图 12-3 所 
示 ， 在 处 理 器 取得 一 条 指令 后 ，EIP 寄存 器 的 数值 加 上 该 指令 的 长 度 减 
1， 得 到 的 结果 必须 小 于 等 于 0x000001FF， 如 果 等 于 或 者 超出 这 个 数 
值 ， 必 然 引 发 异 彰 中断。 


天 Pd 


偏 移 地 址 二 000001FF， 高 端 有 效 物理 地 址 =00007DFF 一 一 > 
EIP 十 指令 长 度 一 1 代码 段 


偏 移 地 址 二 00000000， 低 端 有 效 物理 地 址 二 00007C00 


图 12-3 ”对 代码 段 俩 移 地 址 的 检查 


做 为 一 个 额外 的 例子 ， 现 在 ， 假 设 当 前 代码 段 的 粒度 是 4KB， 那 
么 ， 因 为 描述 符 中 的 段 界 限 值 是 0x001FF， 故 实际 使 用 的 段 界限 是 

a 

可 以 认为 ， 此 数值 束 是 当前 段 内 最 后 一 个 允许 访问 的 偏 移 地 址 。 任 
何 时 候 ，EIP 寄存 器 的 内 容 加 上 取得 的 指令 长 度 减 1， 都 必须 小 于 等 于 
0x001FFFFF， 人 铭 则 将 引发 处 理 磊 寞 钊 中 断 。 


任何 指令 都 不 允许 ， 也 不 可 能 回 代 人 码 段 写 入 数据 。 而 且 ， 只 有 在 代 
码 段 可 读 的 情况 下 由 其 搬 述 从 指定 )， 才 能 由 指令 读 取 其 内 容 。 


12.4.2 ” 栈 操作 时 的 保护 


在 你 护 模 陈 下 操作 时 ， 栈 是 一 个 容 多 令 人 感到 迷惑 的 话题 。 在 截止 
到 目前 的 所 有 例子 中 ， 栈 段 一 二 古 使 用 同 下 扩展 的 内 存 段 ， 段 界限 的 检 
便 和 同上 扩展 的 数据 段 和 代 人 码 段 不 同 。 当 然 ， 栈 也 可 以 使 用 同上 扩展 的 
段 ， 即 ， 把 数据 段 用 做 栈 段 。 在 这 种 情况 下 ， 对 段 寞 限 的 检查 按 数 据 段 
的 规则 进行 ， 但 是 无 论 如 何 ， 栈 本 里 始终 总 是 问 下 增长 的 ， 即 ， 同 低地 
直方 同 推 进 。 段 的 扩展 方 回 用 于 处 理 禹 的 界限 检查 ， 而 对 栈 的 性 质 以 及 
在 栈 上 进行 的 操作 没有 关系 。 在 第 16、17 章 中 ， 我 们 会 接触 到 用 向 上 扩 
展 的 段 作为 栈 段 的 情况 ， 现 在 仍然 只 讨论 网 下 扩展 的 栈 段 。 


对 栈 操作 的 指令 一 般 是 push、pop、ret、iret 等 。 这 些 指令 在 代码 段 
中 执行 ， 但 实际 操作 的 却 是 栈 段 。 


现在 只 讨论 32 位 的 栈 段 ， 即 ， 其 摘 述 符 B 位 是 1 的 线段 。 处 理 需 在 
这 样 的 段 上 执行 压 栈 和 出 栈 操作 时 ， 上 默认 使 用 ESP 寄存 硕 。 

和 前 面 刚刚 讨论 过 的 代码 段 一 样 ， 在 栈 段 中 ， 实 际 使 用 的 段 界限 也 
和 粒度 〈G) 位 相关 ， 如 条 G=0， 实 际 使 用 的 段 寞 限 束 是 描述 符 中 记载 
的 段 界 限 ; 如 来 G 二 1， 则 实际 使 用 的 段 界 限 为 


描述 符 中 的 段 界 限 值 X 0x1000 十 0xFFF 


栈 段 是 同 下 扩展 的 ， 每 当 往 栈 中 压 入 数据 时 ，ESP 的 内 容 要 减 去 操 
作 数 的 长 度 。 所 以 ， 和 问 高 地 址 方 同 扩展 的 段 相 比 ， 非 第 重要 的 一 后 就 
是 ， 实 际 使 用 的 段 界 限 束 是 段 内 不 允许 访问 的 最 低 剖 偏 移 地 址 。 人 至 于 最 
高 靖 的 地 址 ， 则 没有 限制 ， 了 最 大 可 以 是 0xFFFFFFFF 。 也 残 是 说 ， 在 进 
行 栈 操作 时 ， 必 须 符 合 以 下 规则 : 


实际 使 用 的 段 界限 十 1 三 (ESP 的 内 容 一 操作 数 的 长 度 ) 三 0xFFFFFFFF 
在 上 一 章 里 ， 栈 段 的 粒度 是 字 节 (G= 二 0)， ， 描 述 符 中 的 段 界限 是 
0x07A00。 此 时 ， 实 际 使 用 的 段 界 限 也 是 0x07A00。 
假设 现在 ESP 的 内 容 是 0x00007A04， 那 么 ， 执 行 下 面 的 指令 时 ， 
会 怎样 呢 ? 


push edx 


因为 是 要 压 入 一 个 双 字 (4 字 节 ) ， 故 处 理 器 在 向 栈 中 写 入 数据 之 
前 ， 先 将 ESP 的 内 容 减 去 4， 得 到 0x7A00， 这 就 是 ESP 寄存 器 在 进行 压 
栈 操 作 时 的 新 值 。 因 为 该 值 小 于 实际 使 用 的 段 界 限 0x7A00 加 一 
(CO0x7A01) ， 因 此 不 允许 执行 该 操作 。 


但 是 ， 如 果 执 行 的 是 这 条 指令 : 
push ax 


那么 ， 因 为 要 压 入 一 个 字 (2 字 市 ) ， 故 实际 执行 压 栈 操 作 时 ，ESP 
的 内 容 是 


0 /C04—2—0X1C02 


结 宁 大 于 实际 使 用 的 段 界 限 加 一 ， 人 允许 操 作 。 


回 到 本 章 中 ， 看 代码 清单 12-1 第 67 一 69 行 。 这 三 行 设置 栈 的 线性 基 
地 址 为 0x00007C00， 段 界限 为 0xFFFFE， 粒 度 为 4KB， 并 设置 栈 指针 寄 
存 器 ESP 的 初 值 为 0。 


因为 段 界限 的 粒度 是 4KB (G= 二 1) ， 故 实际 使 用 的 段 界限 为 
OxFFFFEX 0x1000+OxFFF=O0xFFFFEFFF 


又 因为 ESP 的 最 大 值 是 0xFFFFFFFF， 因 此 ， 如 图 12-4 所 示 ， 在 操 
作 该 段 时 ， 处 理 器 的 检查 规则 是 : 


0xFEFEEFEFE000 科 CESP 的 内 容 一 操作 数 的 长 度 ) 三 0xFFFFFFFF 


栈 指 针 寄 存 左 ESP 的 内 容 仅 仅 在 访问 栈 时 提供 俩 移 地 址 ， 操 作 数 在 
压 入 栈 时 的 物理 地 址 要 用 段 宥 仓 礁 的 朱 述 符 局 速 缓存 如 中 的 段 基 址 和 
ESP 的 内 容 相 加 得 到 。 因 此 ， 该 栈 最 低 问 的 有 效 物理 地 址 十 


0x00007C00 十 0xFFFFF000 二 0x00006C00 
最 局 问 的 有 效 物理 地 址 十 
Ox00007C00 二 0xFFFFFFFF 二 0x00007BFF 


也 就 是 说 ， 当 前 程序 所 定义 的 栈 空 间 介 于 地 址 为 0x00006C00 一 
0x00007BFF 之 间 ， 大 小 是 4KB。 

现在 结合 该 栈 段 ， 用 一 个 实例 来 说 明 处 理 器 的 检查 过 程 。 代 码 清单 
第 69 行将 ESP 的 初始 值 设 定 为 0， 因 此 ， 当 第 一 次 进行 压 栈 操作 时 ， 假 
如 压 入 的 是 一 个 双 字 (4 字 节 ) : 


push ecx 


因为 压 栈 操 作 是 先 减 ESP， 然 后 再 访问 栈 ， 故 ESP 的 新 值 是 (可 以 
自行 用 Windows 计算 器 算 一 下 ) 


0 一 4 三 0XEFEEEEEREFC 


这 个 结果 符合 上 和 面 的 限制 条 件 ， 人 允许 操作 。 此 时 ， 被 压 入 的 那个 双 
其 线性 地 址 为 


Ox00007C00 二 0xFFFFFFFC 二 0x00007BFC 


A An 


偏 移 地 址 二 FFFFFFFF， 高 端 有 效 物 理 地 址 ==00007BFF 一 一 > 
ESP 十 操作 数 大 小 栈 段 


偏 移 地 址 二 FFFFF000， 低 端 有 效 物理 地 址 二 00006C00 


A An 


图 12-4 对 栈 段 俩 移 地 址 的 检查 


尽管 这 里 讨论 的 是 push 指令 ， 但 对 于 其 他 隐 式 操作 栈 的 指令 ， 比 如 
pop、call、ret 等 ， 情 况 也 没有 什么 不 同 ， 也 要 根据 操作 数 的 大 小 来 检查 
是 否 违 反 了 段 界限 的 约束 ， 以 防止 出 现 访问 越界 的 情况 。 


2.4.3 ”数据 访问 时 的 保护 
这 里 所 说 的 数据 段 ， 特 指向 上 扩展 的 数据 段 ， 有 别 于 栈 和 向 下 扩展 


的 数据 段 。 


因为 是 同上 扩展 的 ， 所 以 代 但 段 的 检查 规则 同样 适用 于 数据 段 。 不 
同 之 处 仅仅 在 于 ， 对 于 取 指 令 来 说 ， 是 人 否 越界 取决 于 指令 的 长 度 ; 而 对 
于 数据 段 来 说 ， 则 取决 于 操作 数 的 尺寸 。 考 虑 以 下 指令 : 


= 


mov [Ox2000] ,edx 


这 条 指令 将 访问 内 存 ， 并 将 EDX 寄存 器 的 内 容 写 入 当前 段 内 偏 移 量 
为 0x2000 的 双 字 单元 。 指 令 中 给 出 了 内 存单 元 的 有 效 地 址 
EA (CO0x2000) ， 也 给 出 了 操作 数 的 大 小 〈4) 。 


很 好 ， 现 在 ， 当 人 处理 占 访问 数据 段 时 ， 要 依据 以 下 规则 进行 检 枉 : 


0 三 (EA 十 操作 数 大 小 一 1) 三 实际 使 用 的 段 界 限 


在 任何 时 候 ， 段 界限 之 外 的 访问 企图 部 会 被 阻 止 ， 并 引 友 处 理 虱 寞 
音 中 靳 。 


在 32 位 处 理 恬 上 ， 尽 管 段 界限 的 检查 总 在 进行 着 ， 但 如 果 段 界限 具 
有 最 大 值 ， 则 对 任何 内 存 地 址 的 访问 都 将 不 会 违例 。 比 如 本 章 束 定义 了 
一 个 具有 4GB 长 的 段 ， 段 的 基地 址 是 0x00000000 ， 段 界限 是 
0xFFFFF， 镁 度 为 4KB。 因 此 ， 实 际 使 用 的 段 界 限 是 


OxFFFFF x Ox1000++OxFFF=O0xFFFFFFFF 


在 这 样 的 段 内 ， 访 问 任 何 一 个 内 存单 元 者 是 允许 的 ， 针 对 段 界 限 的 
习 查 都 会 获得 通过 。 

在 32 位 模式 下 ， 处 理 帮 使 用 32 位 的 段 基地 址 加 上 32 位 的 偏 移 量 ， 
共同 形成 32 位 的 物理 地 址 来 访问 内 和 存 。 上 段 基地 址 由 上 段 插 述 从 指定 ， 而 偏 
移 量 由 指令 直接 或 痢 间 接 给 出 。 很 显然 ， 和 在 段 最 大 的 时 候 ， 可 以 目 由 访 
问 4GB 空间 内 的 任何 一 个 单元 。 


代码 清单 12-1 第 71~~74 行 ， 从 物理 地 址 0x000B8000 开始 写 入 16 
字 节 的 内 容 ， 用 于 演示 4GB 内 存 地 址 空间 的 访问 。 段 寄存 器 ES 当前 正 
指 问 0 到 4GB 的 内 存 空间 ， 其 描述 符 高 速 缓存 器 中 的 其 地址 是 
0x00000000， 加 上 指令 中 提供 的 32 位 偏 移 量 ， 所 访问 的 地 方正 是 显示 
缓冲 区 (显存) 所 在 的 区 域 。 这 其 中 的 道理 很 简单 ， 首 先 ， 内 存 的 寻 址 
依赖 于 段 基 地 址 和 偏 移 地 址 ， 段 基地 址 是 0， 所 以 ， 可 以 把 任何 要 访问 的 
物理 地 址 作为 偏 移 量 。 


这 16 字 节 的 内 容 是 8 个 字符 的 ASCI 码 ， 以 及 它们 各 自 的 显示 属性 
(颜色 ) 。 如 图 12-5 所 示 ， 和 人 往 第 一 样 ， 双 和 字 在 内 存 中 的 写 入 依然 是 低 
病 字 末 序 的 ， 这 里 再 次 展示 一 下 ， 以 帮助 理解 。 


| | 07 2E 07 50 


aa 

000B8002 一 日 
89RSD 

00B8000 < 


| | 


图 12-5 ”以 低 端 字 节 序 向 内 存 中 写 入 双 字 


要 理解 32 位 模式 下 的 寻 址 ， 以 及 数据 访问 时 的 保护 机 制 ， 这 是 一 个 
很 好 的 例子 。 

检测 点 12.2 

当前 栈 段 描述 符 的 B 位 是 1， 基 地 址 为 0x00700000 ， 界 限 值 为 
0xFFFFE 。 那 么 ， 在 32 位 模式 下 ， 访 栈 段 的 有 效 地 址 范围 是 
0x00700000 一 ( ) 。 当 ESP 的 内 容 为 0xFFFFF002 时 ， 还 能 压 入 
一 个 双 字 吗 ? 为 什么 ? 





12.5 ”使 用 别名 访问 代码 段 对 字符 排序 


接 下 来 要 做 的 事情 是 对 一 串 散 乱 的 字符 进行 排序 。 坦 白地 说 ， 排 序 
是 假 ， 主 要 目的 是 演示 如 何在 保护 模式 下 使 用 别名 上 段 。 

字符 串 位 于 代码 清单 12-1 的 第 105 行 ， 用 标号 string 声明 ， 并 初始 
化 为 以 下 字符 : 


sO0Oke4or92xap3fv8giuzjcy5l1lm/hd6ébnqtw. 


这 四 字符 是 主 引 导 程 序 的 一 部 分 ， 在 进入 保护 贷 式 时 ， 它 瓯 位 于 32 
位 代码 段 中 。 代 人 码 段 是 用 来 执行 的 ， 能 不 能 读 出 ， 取 决 于 其 插 述 从 的 类 
列 字 段 。 但 是 无 论 如 何 ， 它 都 不 允许 与 人。 

这 可 就 难 办 了 。 我 们 想 束 地 把 这 串 字 和 从 按 ASCIl 码 从 小 到 大 排列 ， 
涉及 诛 地 与 入 数据 的 操作 。 好 在 前 面 已 经 建立 了 代码 段 的 询 名 摘 述 符 ， 
而 且 用 段 寄存 右 DS 指 问 它 。 参 见 代 人 码 清单 12-1 第 59、60 行 。 


冒 泡 排 友 是 比较 容易 理解 的 排序 算法 ， 但 却 并 不 是 效 识 最 局 的 ， 
此 ， 速 度 目 然 也 瓯 很 怪 。 如 采 字 人 符 串 的 长 度 《〈 字 符 的 数量 ) 是 n 个 ， 而 且 
要 从 小 到 大 排序 ， 那 么 ， 可 以 将 它们 从 头 人 至 尾 两 两 比较， 需要 比较 mn-1 
次 。 但 是 ， 不 要 高 兴 太 早 ， 这 一 次 过 历 只 会 使 最 大 的 那个 字符 慢 慢 地 、 
像 气 泡 一 样 移动 到 节 右 边 。 

所 以 ， 你 需要 多 次 进行 这 样 的 过 有 历 才 能 完成 所 有 字符 的 排序 ， 每 一 
次 示 有 历 都 会 使 一 个 字符 骨 泡 到 正确 的 位 置 。 可 以 计算 ， 共 需要 n-1 次 这 样 
的 过 历 。 有 关 骨 泡 排序 算法 的 更 多 信息 ， 请 参考 其 他 资料 。 

可 元， 这 需要 两 个 循环 ， 一 个 外 循环 ， 用 于 控制 表 历 次 数 ; 一 个 内 
循环 ， 用 于 控制 每 次 遇 历 时 的 比较 次 数 。 在 32 位 模式 下 ，loop 指令 所 用 
的 计数 右 不 是 CX， 而 是 ECX。 两 个 循环 需要 共用 ECX， 这 需要 点 技巧 ， 
那 殉 是 利用 栈 : 


mov ecx,n-1 ;控制 遍历 次 数 ， 内 、 外 循环 都 用 它 
external: 
xor ebx,ebx ; 清 零 ， 从 字符 串 开 头 处 比较 


push ecx 


internal: 
; 对 字符 串 两 两 比较 
inc ebx 


loop internal 


pop ecx 


loop external 


我 相信 这 上 段 框 淋 性 的 代码 还 是 很 好 理解 的 。 外 循环 忌 共 执行 nh-1 次 。 
每 执行 一 次 外 循环 ， 内 循环 融会 将 一 个 数 排 到 正确 的 位 置 ， 从 而 使 下 一 
次 内 循环 少 一 次 两 两 比 对 《〈 少 执行 一 次 ) 。 也 就 是 说 ，ECX 寄存 如 的 当 
击 值 总 古 内 循环 的 次 数 ， 这 束 古 为 什么 内 循环 的 loop 指令 要 便 用 外 循环 
的 ECX 值 。 


代码 清单 12-1 第 77 行 ， 用 后 面 的 标号 pdgt 减 去 声明 字符 串 的 标号 
string， 束 是 字符 串 的 长 度 ， 再 减 去 一 ， 束 是 控制 循环 的 次 数 。 

第 79 行 ， 将 循环 次 数 压 栈 ， 因 为 内 循环 会 改变 ECX 的 内 容 。 

第 80 行 ， 清 零 BX 寄存 需 。 访 寄存 器 在 每 次 内 部 循环 之 前 清 零 ， 用 
于 从 字符 串 的 开始 处 进行 比 对 。 之 所 以 没有 使 用 EBX， 是 因为 要 让 你 知 
道 ，32 位 代码 中 也 可 以 使 用 16 位 的 寄存 器 来 寻 址 。 注 意 ， 我 们 知道 ， 在 
32 位 模式 下 ， 如 果 指 令 的 操作 数 是 16 位 的 ， 要 加 前 级 0x66。 相 似 地 ， 
在 32 位 模式 下 ， 如 果 要 在 指令 中 使 用 16 位 的 有 效 地 址 ， 那 么 ， 必 须 为 该 
指令 添加 前 级 0x67。 因 此 ， 当 指令 


mov ea [BXl| 


用 bits 32 编译 后 ， 会 有 指令 前 级 0x67;， 在 32 位 模式 下 执行 时 ， 处 理 
器 会 用 数据 段 描 述 符 中 给 出 的 32 位 数据 段 基 地 址 ， 加 上 BX 寄存 器 的 16 
位 偏 移 量 ， 形 成 32 位 线性 地 址 。 


实际 进行 字符 比 对 的 代码 是 第 81~~91 行 。 首 先 一 次 性 读 取 两 个 字符 
到 AX 寄存 融 中 。 当 前 的 数据 段 定 由 段 寄 存 兰 DS 指 问 的 ， 其 插 述 从 给 出 


的 基地 址 为 0x00007C00， 和 字符 串 的 首 地 址 就 是 标号 string 的 汇编 地 址 ， 
哥 和 存 右 BX 用 来 指定 字符 串 内 的 偶 移 量 。 

接 看 ， 对 寄存 占 AH 和 AL 的 内 容 进 行 比 较 。 如 图 12-6 所 示 ，AL 中 
存放 的 是 前 一 个 字符 ，AH 中 存放 的 是 后 一 个 字符 。 如 果 前 一 个 字符 较 
大 ， 则 交换 AH 和 AL 的 内 容 ， 然 后 重新 写 回 原来 的 字 单 元 。 然 后 ， 将 BX 
寄存 需 的 内 容 加 一 ， 以 指 同 下 一 个 字符 。 

xchg 是 交换 指令 ， 用 于 交换 两 个 操作 数 的 内 容 ， 源 操作 数 和 目的 操 
作 数 都 可 以 是 8/16/32 位 的 寄存 器 ， 或 者 指 问 8/16/32 位 实际 操作 数 的 内 
存 早 元 地 址 ， 但 不 允许 两 者 同时 为 内 存 地 址 。 其 格式 为 


xCcho /me 78 
no rymle rls 
xeheo rr/m32 L332 
xChy ie mS 
GO 


Xeng 2 


准 个 例子 : 


mov ecx, OxfO0O00f000 
mov edx, Oxabcdef00 


xChg ecx,edx 


以 上 指令 执行 后 ， 寄 存 器 ECX 中 的 内 容 为 OxXABCDEF00，EDX 中 
的 内 容 为 0xF000F000。 





图 12-6 ”通过 AX 寄存 器 比 对 和 排序 相 邻 字符 


第 93 一 100 行 用 于 蛙 示 节 终 的 排序 结束 ， 同 样 使 用 了 循环 ， 循 环 次 
数 吏 是 字符 种 的 长 度 。 和 排序 的 时 候 不 同 ， 现 在 终于 使 用 EBX 了 ， 这 将 
提供 32 位 的 偶 移 地 址 。 


第 96 行 ， 同 寄存 名 AH 传送 的 是 字符 的 显示 属性 颜色) ，0x07 表 
示 黑 底 白 字 ， 我 们 已 经 无 数 次 重复 说 过 了 。 
第 98 行 是 问 显 存 中 传送 字符 及 其 显示 属性 : 


mov [es:0xb80a0+t+ebx*2],ax 


段 寄 存 器 ES 是 在 刚 进 入 保护 模式 时 设置 的 ， 它 指向 0 一 4GB 内 存 的 
段 。0xb80a0 等 于 0xb8000 加 上 十 进 制 数 160 (0xa0) 。 在 显存 中 ， 偏 
移 量 为 160 的 地 方 对 应 痢 屏 幕 第 2 行 第 1 列 。32 位 处 理 喜 提供 了 强大 的 
寻 址 方式 ， 可 以 在 基 址 寄存 器 的 基础 上 使 用 比例 因子 ， 这 里 是 将 EBX 寄 
存 器 的 内 容 滋 以 2。 当 EBX 的 内 容 为 0、1、2、3、... 时 ， 计 算出 来 的 有 
效 地 址 分 别 是 0xb80a0、0xb80a2、0xb80a4、0xb80a6、...， 后 面 的 以 
此 类 推 ， 很 容易 看 到 使 用 比例 因子 的 好 人 处。 注意 ， 该 表达 式 的 值 是 在 本 
指令 执行 时 ， 由 处 理 器 来 计算 的 。 

最 后 ， 在 完成 了 所 有 的 工作 之 后 ， 第 102 行 ，hlt 指令 使 处 理 器 人 处 于 
停机 状态 。 


12.6 程序 的 编译 和 运行 


本 章 代 码 清 单 12-1 所 对 应 的 源 程序 文件 是 c12_mbr.asm， 用 
Nasmide 工具 将 它 打 开 并 编译 ， 生 成 二 进 制 文 件 c12_ mbrbin 并 写 入 虚 
拟 硬盘 的 主 引 导言 区 。 

然后 ， 启 动 虚拟 机 LEARN-ASM， 观 察 运行 结果 。 正 常情 况 下 ， 屏 幕 
显示 如 图 12-7 所 示 。 


LEARN-ASM [正在 运行 ] - Oracle VM VirtualBox 


sn 1 河 基 
.0123456789abcdef ghi jk lmnopgqrstuvwxyz 








分 要 口 委 | @ 因 Right Ctrl .| | 
| 


图 12-7 本 章程 序 运行 结果 











本 章 习 题 


1. 修改 本 章 代 人 码 清单 ， 使 之 可 以 检测 1MB 以 上 的 内 存 空间 〈 从 地 
址 0x00100000 开始 ， 不 考 夸 高 速 缓存 的 影响 )》 。 要 求 : 对 内 存 的 谈 写 按 
双 字 的 长 度 进 行 ， 并 在 检测 的 同时 显示 已 检测 的 内 存 数 量 。 建 议 对 每 个 
双 字 单元 用 两 个 花 码 0x55AA55AA 和 0xAA55AA55 进行 检测 。 


第 13 章 ”程序 的 动态 加 载 和 执行 


像 我 一 和 任 ， 很 多 人 在 了 解 了 你 护 侦 陈 的 基本 工作 原理 之 后 ， 会 产生 
一 个 疑问 。 那 束 古 ， 所 有 的 段 在 使 用 之 前 ， 部 必须 以 手 述 人 符 的 形式 在 插 
述 休 表 中 进行 定义 ， 那 么 ， 像 操作 系统 这 样 的 软件 ， 叉 怎么 能 够 加 载 和 
执行 其 他 各 种 用 户 程 序 呢 ? 羊 葛 ， 你 并 不 知道 这 些 程序 都 定义 了 哪些 
段 ， 每 个 段 是 什么 类 型 ， 有 多 长 。 

未 必 所 有 人 部 会 产生 这 样 的 疑 恶 ， 但 我 确实 算 一 个 ， 可 能 我 还 不 够 
聪明 。 事 实 上 ， 这 仪 仅 古 一 层 窗户 纸 ， 一 旦 捅 破 了 ， 才 友 现 原来 况 是 那 
么 何 单 。 从 和 示 种 意义 上 来 说 ， 你 护 模 式 的 工作 机 制 对 用 尸 程 序 的 加 载 和 
执行 非但 没有 增加 困难 ， 及 而 市 来 了 很 大 的 便利 。 

一 套 能 够 公分 说 明 问 题 的 例子 需要 很 大 的 代 人 码 量 ， 也 许 把 本 书 的 汉 
字 部 去 挥 ， 全 部 换 成 代码 也 不 够 。 不 过 ， 只 要 能 说 明 问 题 ， 也 不 一 定 非 
得 完 普 周全、 面面俱到。 因此， 本章 中 用 于 加 载 和 处 理 用 户 程 序 的 做 
法 ， 不 一 定 ， 革 至 根本 融 不 是 操作 系统 采用 的 方法 。 这 一 点 ， 务 必 明 
人 


计算 机 硬件 之 上 是 软件 。 软 件 分 两 个 层次 ， 一 是 操作 系统 ， 二 是 应 
用 用户) 程序。 通常， 用户 程 序 只 关心 问题 的 解 ， 束 是 采用 各 种 算法 
来 解决 实际 问题 。 至 于 软件 是 怎么 加 载 到 内 存 的 ， 怎 么 定位 的 ， 不 是 它 
所 操心 的 事 。 但 是 ， 它 有 义务 提供 一 些 必要 的 信息 ， 来 帮助 操作 系统 将 
目 己 加 载 到 内 存 中 。 


相反 ， 操 作 系 统 则 必须 考虑 及 用 什么 方法 来 加 载 用 尸 程 序 ， 并 在 适 
当 的 时 低 将 处 理 右 的 执行 法 转移 到 用 尸 代 人 码 中 去 。 同 时 ， 为 了 减轻 用 三 
程序 的 工作 量 ， 操 作 系 统 还 应 当 管 理 人 硬件 ， 并 提供 大 量 的 例 程 供用 户 程 
序 使 用 。 比 如 ， 喧 示 一 个 字符 串 ， 束 不 要 让 用 户 目 己 来 瑟 代 人 码 了， 生 接 
调用 操作 系统 的 代码 即 可 。 但 操作 系统 和 用 尸 程序 应 当 协 两 一 种 机 制 ， 
让 用 户 程 序 能 够 在 使 用 这 些 例 程 时 ， 不 必 考 虑 和 关心 它们 的 位 置 。 

本 章 提 供 了 一 个 小 小 的 “操作 系统 "， 因 为 当 不 起 这 么 大 的 名 称 ， 所 以 
咱 " 内 核 ? 或 者 "核心 ”。 即 使 是 这 样 ， 它 依然 当 不 起 ， 因 为 它 实 在 是 太 人 简单 
了 了 。 不 过 ， 也 没有 办 法 ， 束 这 么 竣 合 看 叫 吧 ，。 


内 核 不 能 放 到 主 引导 而 区 里 ， 毕 竟 它 都 很 大 。 所 以 ， 计 算 机 首先 从 
主 引 导 程 序 开始 执行 ， 主 引导 程序 负责 加 载 内 核 ， 并 转交 控制 权 。 然 
后 ， 内 核 负 责 加 载 用 户 程 序 ， 并 提供 各 种 例 程 给 用 户 程序 调用 。 提 供给 
用 户 程 序 调用 的 例 程 也 叫 应 用 程序 接口 (Application Programming 
Interface，API，〉， 本 章 用 简 蛙 的 方法 来 允许 用 户 程 序 使 用 API 工作 。 


本 章 学 习 目 标 : 

1， 了 解体 护 模 陈 是 为 操作 系 红 提 供 的 技术 ， 并 没有 给 普通 应 用 程序 
的 编程 市 来 负担 〈 这 从 本 章 的 程序 实例 中 残 可 以 看 出 来 ) 。 

2. 学 习 操作 系统 在 保护 模式 下 加 载 和 重 定位 应 用 程序 的 一 般 原 理 ， 
学 习 人 简单 的 内 存 动态 分 配 ， 了 解 应 用 程序 接口 API 的 简单 原理 ， 学 习 字 
符 串 的 比较 算法 。 

3. 学 习 厂 干 X86 处 理 右 的 新 指令 ， 包 括 bswap、cpuid、cmovcc、 
sgdt、movzx、movsx、cmpsb、cmpsw、cmpsd 和 xlat 等 。 


13.1 本 章 代 码 清 单 






13.2 内核 的 结构 、 功 能 和 加 载 


13.2.1 内 核 的 结构 


内 核 分 为 四 个 部 分 ， 分 别 是 初始 化 代码 、 内 核 代 码 段 、 内 核 数 据 段 
和 公共 例 程 段 ， 主 引导 程序 也 是 初始 化 代码 的 组 成 部 分 。 

初始 化 代码 用 于 从 BIOS 那里 接管 处 理 右 和 计算 机 硬件 的 控制 权 ， 安 
装 最 基本 的 段 描述 符 ， 初 始 化 最 初 的 执行 环境 。 然 后 ， 从 硬盘 上 读 取 和 
加 载 内 核 的 剩余 部 分 ， 创 建 组 成 内 核 的 各 个 内 存 段 。 初 始 化 代码 大 部 分 
位 于 代码 清单 13-1 中 。 

内 核 的 代码 和 数据 位 于 代码 清单 13-2 中 。 如 图 13-1 所 示 ， 内 核 代 三 
段 是 在 第 385 行 定义 的 ， 用 于 分 配 内 存 ， 读 取 和 加 载 用 户 程 序 ， 控 制 用 
户 程 序 的 执行 。 


16 ”内核 头 部 数据 ， 供 加 载 时 定位 内 核 的 各 个 部 分 


34 section sys routine vstart=0 ;会 用 例 程 段 


330 section core data vstart=0 ;内 核 数据 段 


385 section core code vstart=0 ; 内核 代码 段 


599 section core trail ;尾部 ， 用 于 计算 内 核 长 度 





图 13-1 内 核 程 序 的 各 个 组 成 部 分 


内 核 数 据 段 是 在 第 330 行 定 义 的 ， 提 供 了 一 段 可 读 写 的 内 存 空 间 ， 
供 内 核 自 己 使 用 。 

公共 例 程 段 是 在 第 34 行 定 义 的 ， 用 于 提供 各 种 用 途 和 功能 的 子 过 程 
以 简化 代码 的 编写 。 这 些 例 程 既 可 以 用 于 内 核 ， 也 供用 户 程 序 调用 。 

除了 以 上 的 内 容 之 外 ， 内 核 文 件 还 包括 一 个 头 部 ， 记 录 了 各 个 段 的 
汇编 位 置 ， 这 些 统计 数据 用 于 香 诉 初始 化 代码 如 何 加 载 内 核 。 

回 到 代码 清单 13-2 的 开头 。 

从 第 7 行 开 始 ， 一 直到 第 12 行 ， 用 于 声明 常数。 很 明显 ， 这 是 一 些 
内 存 段 的 选择 子 ， 它 们 对 应 的 描述 符 会 在 内 核 初始 化 的 时 候 创 建 。 这 些 
段 是 内 核 的 段 ， 供 内 核 代 码 使 用 ， 对 内 核 代 码 是 透明 的 ， 内 核 代 码 “ 知 道 * 
每 个 段 选择 子 的 具体 数值 ， 就 象 你 知道 自己 办 公 室 里 有 哪些 人 ， 可 以 直 


接 喊 他 的 名 字 让 他 做 某 件 事 一 样 。 但 是 ， 段 选择 子 的 具体 数值 是 和 它们 
在 GDT 中 的 位 置 相关 的 。 为 了 不 至 于 在 往 后 因为 调整 段 的 位 置 而 修改 程 
序 代码 ， 将 它们 声明 成 常数 是 最 好 的 。 我 们 知道 ， 伪 指令 equ 仅仅 是 人 允 
许 我 们 用 符号 代 蔡 具体 的 数值 ， 但 声明 的 数值 并 不 占用 空间 。 

内 核 文件 的 真正 开始 部 分 是 头 | | 
部 ， 偏 移 量 为 0x00 的 地 方 是 一 个 双 


字 ， 可 以 通过 标号 core_length 引用 ， 

记录 了 整个 内 核 文 件 的 大 小 ， 以 字 市 

为 单位 ; 偏 移 量 为 0x04 的 地 方 是 公用 
例 程 段 的 起 始 汇 编 地 址 ， 是 一 个 双 "00000 


字 ， 可 以 通过 标号 sys_routine seg 引 
用 ; 偏 移 量 为 0x08 的 地 方 是 核心 数据 


段 的 起 始 汇编 地 址 ， 也 是 一 个 双 字 ， 
可 以 通过 标号 core_data_ seg 引用 ; 文本 模式 显 式 缓冲 区 
000B8000 


偏 移 量 为 0x0C 的 地 方 是 核心 代码 段 的 
起 始 汇编 地 址 ， 双 字 大 小 ， 可 以 通过 
标号 core code seg 引用 ; 从 偏 移 量 


为 0x10 开始 的 地 方 用 于 指示 内 核 入 口 
点 ， 可 以 通过 标 亏 core_entry 引用 ， 系统 核心 程序 和 数据 
在 主 引 寻 程 序 加载 了 内 核 之 后 ， 从 这 nn 


里 把 处 理 亏 的 控制 权 交 给 凡 核 代码 。 
注意 ， 不 要 起 了 这 个 表达 式 ， 我 们 以 
前 学 过 的 ， 它 用 来 得 到 上 段 的 起 始 和 汇编 
地 址 : 全 局 描述 符 表 GDT 





00007E00 
初始 化 代码 段 
〈《 主 引导 程序 ) 

00007C00 


系统 核心 栈 


00006C00 
图 13-2 ”本章 内 存 布局 示意 图 


section .< 段 名 称 >.statt 


入 口 点 共有 6 字 节 ， 低 地 址 部 分 是 一 个 双 字 ， 指 示 段 内 偶 移 ， 将 来 会 
传送 到 指令 指针 寄存 器 EIP， 它 来 自 一 个 标 写 start， 位 于 第 531 行 ， 高 地 
址 部 分 是 一 个 字 ， 指 定 一 个 内 存 代 码 段 的 选择 子 。 在 这 里 ， 填 充 的 是 刚 
刚 在 第 7 行 声 明 过 有 的 和 常数 core_code_seg_sel， 在 数值 上 等 于 0x38。 


13.2.2 内核 的 加 载 


现在 来 看 代码 清单 13-1， 也 就 是 主 引 导 程 序 。 

第 6 行 和 第 7 行 声 明了 两 个 和 常数， 分 别 是 内 核 程序 在 人 硬盘 上 的 位 置 ， 
以 及 它 将 要 被 加 载 的 物理 内 存 地 址 。 声 明 常 数 的 好 处 你 也 知道 ， 将 来 改 
起 来 方便 。 

接 下 来 ， 从 第 9 行 开始 ， 一 直到 第 55 行 ， 是 为 进入 保护 模式 做 准 
备 。 如 图 13-2 所 示 ， 因 为 主 引 导 程 序 的 加 载 位 置 是 物理 地 址 
0x00007C00， 所 以 ， 从 这 个 位 置 往 上 是 512 字 节 的 初始 化 代码 段 ， 从 这 
个 位 置 往 下 是 4KB 的 内 核 栈 。 

全 局 描述 符 表 (GDT) 是 不 可 或 缺 的 ， 和 从 前 一 样 ， 我 们 将 它 定义 
在 从 物理 地 址 0x00007E00 开 始 的 地 方 ， 紧 挨 着 初始 化 代码 段 。GDT 可 
大 可 小 ， 最 大 能 达到 64KB， 所 以 ， 它 的 空间 一 定 要 留 够 。 

和 GDT 一 样 ， 内 核 程序 的 大 小 也 是 不 定 的 ， 但 可 以 规定 它 的 起 始 位 
置 。 在 这 里 ， 我 们 决定 将 它 加 载 到 从 物理 内 存 地 址 0x00040000 开始 的 地 
方 。 从 这 个 地 方 往 上 ， 一 直到 0x0009FFFF， 都 是 它 的 地 盘 ， 取 决 于 它 到 
底 有 多 大 ， 想 用 多 少 就 用 多 少 。 从 0x000A0000 往 上 ， 是 ROM BIOS， 
便 件 专 有 的 。 

显示 器 是 宽 视 程序 工作 的 窗口 ， 显 示 功 能 自然 少不了 。 因 此 ， 从 
0x000B8000 往 上 的 32KB， 是 文本 模式 的 显示 绥 冲 区 。 

最 后 ， 从 1MB 开始 的 大 量 空 间 是 留 给 用 户 程 序 用 的 ， 具 体 数 量 取 决 
于 你 到 底 安 装 了 多 少 物理 内 存 。 对 于 本 章 来 说 ， 程 序 都 很 小 ， 功 能 都 很 
简单 ， 用 不 了 多 少 内 存 空 间 ， 都 才 几 KB、 几 十 KB; 但 是 ， 你 平时 所 用 的 
Windows、Linux 和 MacOS， 以 及 运行 于 其 上 的 程序 ， 都 是 VIP、 大 客 
户 ， 动 略 几 MB、 几 百 MB。 


在 进入 你 护 模式 之 前 ,初始化 程序 〈 主 引导 程序 ) 已 经 在 全 局 拍 述 
伯 表 (GDT) 中 安 普 了 几 个 必要 的 接 述 行 。 如 图 13-3 所 示 ， 第 一 个 是 用 


于 访问 0~4GB 内 存 的 数据 段 ， 它 很 重要 ， 内 核 只 有 在 具备 了 访问 全 部 
4GB 内 和 存 空 间 的 能 力 时 ， 才 能 随心 所 欲 地 做 任何 事情 。 

第 二 个 是 初始 化 代码 段 ， 也 束 是 主 引导 程序 所 在 的 段 。 进 入 保护 模 
式 后 ， 要 继续 执行 主 引 叶 程 序 的 后 半 部 分 代码， 必须 控 处 理 占 的 要 求 ， 
为 它 创建 插 述 从 。 

最 后 两 个 分 别 是 初始 的 栈 段 和 显示 缕 冲 区 的 描述 行 。 这 里 定义 的 栈 
在 初始 化 过 程 中 束 要 使 用 ， 而 在 进入 内 核 之 后 ， 它 义 是 内 核 的 栈 。 

创建 这 些 揪 述 从 的 代码 位 于 代码 清单 13-1 的 第 19 一 40 行 ， 这 几 个 拉 
述 和 从 都 和 上 一 章 差 不 多 ， 而 且 用 于 创建 它们 的 代码 也 基本 相同 ， 不 再 未 
个 讲解 。 

表 内 偏 移 量 描述 符 案 引 


Pp 初始 栈 段 (00006C00 一 00007C00 ) 0x18 
-10 初始 代码 段 〈00007C00 一 00007DFF ) Ox10 


0 一 4GB 数 据 段 《00000000 一 FFFFFFFF ) Ox08 





图 13-3 ”进入 你 护 模式 前 创建 的 插 述 符 


下 面 开 始 加 载 内 核 。 

首先 是 初始 化 各 个 段 寄存 占 以 访问 相应 的 内 存 段 。 第 59、60 行 ， 使 
DS 指向 全 部 4GB 的 内 存 空间 ; 第 62 一 64 行 ， 使 SS 指向 初始 的 栈 空 
间 ， 并 初始 化 栈 指针 寄存 器 ESP 的 内 容 为 0。 第 一 个 数据 压 入 时 ， 因 为 栈 
的 操作 是 先 减 ESP 的 值 ， 再 保存 数据 ， 所 以 ， 如 果 是 压 入 一 个 字 ，ESP 
的 内 容 为 0xFFFFFFFE; 如 果 压 入 的 是 双 字 ，ESP 的 内 容 为 
OxFFFFFFFC. 


接 下 来 是 从 硬盘 把 内 核 程 序 谈 入 内 存 ， 第 67 一 69 行 ， 它 在 便 检 上 的 
起 始 逻辑 扇 区 号 和 物理 内 存 地 址 已 经 由 两 个 常数 给 出 ， 现 分 别 将 它们 传 
送 到 EAX 和 EDI 寄存 器 。 

急 始 化 代码 并 不 知道 内 核 有 多 大 ， 上 所 以 也 束 不 知道 应 该 谈 多 少 个 剧 
区 。 不 过 ， 它 可 以 先 读 一 个 而 区 ， 因 为 那里 包 售 着 内 核 的 头 部 数据 ， 根 


据 这 些 数 据 ， 吏 可 以 知道 内 核 的 总 而 区 数 。 

和 以 前 一 样 ， 我 们 把 读 便 盘面 区 的 指令 归 拢 到 一 起 ， 做 成 可 以 反复 
调用 的 过 程 read_hard _ disk_0， 它 位 于 第 138 一 192 行 。 基 本 上 ， 它 的 工 
作 过 程 和 具体 的 代码 都 和 从 前 一 样 ， 但 略 有 不 同 。 首 先 ， 议 过程 要 求 使 
用 EAX 寄存 需 来 传 入 28 位 的 馆 辑 而 区 亏 。 我 们 现在 已 经 可 以 使 用 32 位 
的 寄存 器 了 ， 再 也 不 会 因为 16 位 寄存 器 太 小 ， 无 法 容纳 28 位 的 逻辑 而 区 
写 而 发 悉 。 


其 次 ， 这 里 使 用 EBX 寄存 带 来 传 入 仿 移 地 址 。 因 为 在 32 位 模式 下 ， 
可 以 访问 全 部 4GB 内 存 ， 人 允许 使 用 32 位 的 偏 移 地 址 。 这 是 好 事 ， 我 们 再 
也 不 需要 为 64KB 的 段 而 受 折 麻 了 。 


最 后 一 个 不 同 之 处 在 于 ， 每 次 过 程 返回 时 ， 会 使 EBX 寄存 器 的 值 比 
原来 多 512。 这 是 有 意 的 ， 因 为 在 32 位 模式 下 ， 内 存 的 访问 不 再 受 64KB 
限制 ， 所 以 就 能 够 连续 访问 。 这 里 ， 每 次 将 EBX 寄存 器 的 内 容 加 上 
512， 目 的 是 指 癌 下 一 个 内 存 块 ， 我 相信 这 种 工作 方式 会 给 调用 它 的 主 程 
序 市 来 方便 。 

接 下 来 是 取得 内 核 的 长 度 ， 并 计算 它 所 占用 的 扇 区 数 。 

因为 段 寄 存 器 DS 是 指 问 4GB 内 存 段 的 ， 其 接 述 和 从 高 速 绥 存 中 的 基 
地 址 是 0x00000000， 故 ， 第 75 行 ， 可 以 直接 用 EDI 寄存 器 中 的 数值 作为 
偏 移 量 来 访问 内 存 ， 最 终生 成 的 线性 地 址 在 数值 上 和 EDI 寄存 器 的 内 容 
相同 。 当 前 指令 的 功能 是 取得 内 核 的 总 长 度 ， 因 为 它 就 位 于 内 核 的 偏 移 0 
处 。 

第 75 一 77 行 ， 将 取得 的 忌 字 厄 数 除 以 512， 束 能 在 EAX 寄存 硕 中 得 
到 内 核 所 占用 的 夯 区 数 。 不 过 ， 在 没 能 整除 的 情况 下 ， 实 际 的 而 区 总 数 
要 比 EAX 寄存 需 中 的 值 多 一 。 

但 是 ， 我 们 要 的 是 剩余 而 区 数 ， 毕 葛 已 经 谈 了 一 个 。 为 此 ， 第 79 一 
81 行 ， 先 判断 EDX 寄存 器 中 的 余数 是 否 为 零 。 取 决 于 EDX 的 实际 内 
容 ，or 指令 会 影响 ZF 标志 位 。 如 果 EDX 不 为 零 ， 则 EAX 寄存 器 里 实际 
上 就 是 剩余 的 局 区 数 ， 因 为 它 比 实际 的 而 区 数 少 一 。 相 反 ， 如 果 EDX 的 
内 容 为 零 ， 则 EAX 中 的 内 容 就 是 总 扇 区 数 ， 还 要 用 dec 指令 减 一 才 行 。 

无 论 是 哪 种 情况 ， 指 令 的 执行 流程 都 会 到 达 第 83 行 。 这 个 地 方 指令 
是 


OF eax eax 


这 条 指令 的 工作 是 检查 EAX 寄存 规 ， 看 它 的 内 容 是 否 为 零 。 第 84 
行 ， 如 末 为 零 ， 说 明 内 核 丈 占用 了 一 个 届 区 确实 够 小 的 ， 但 一 般 不 太 
可 能 ) ， 于 是 不 再 读 人 硬盘， 直接 转 到 标号 setup 处 执行 。 


第 87 一 93 行 ， 用 于 从 硬盘 读 取 剩余 的 扇 区 ， 用 的 是 loop 指令 循环 读 
取 ， 循 环 的 次 数 在 ECX 寄 存 器 中 。 再 重复 一 志 ，32 位 模式 下 的 循环 指 
令 需 要 使 用 ECX 寄存 器 ， 而 不 是 CX。 如 果 没 有 第 83、84 行 的 条 件 判 
条 ， 而 且 剩 余 扇 区 数 为 0， 那 么 ， 这 里 的 循环 将 执行 0OxFFFFFFFF 十 1 
次 ， 显 然 不 是 我 们 希望 的 。 


13.2.3 ”安装 内 核 的 段 描述 符 


要 使 内 核 工作 起 来 ， 首 要 的 任务 是 为 它 的 各 个 段 创 建 描 述 符 。 换 名 
话说 ， 还 要 为 GDT 续 添 新 的 朱 述 符 。 进 入 傈 护 醒 式 前 ， 我 们 在 代码 清单 
13-1 的 第 42 行使 用 指令 


loadt cs Daoudtctoxeo0| 


来 加 载 全 局 描述 符 表 寄 存 器 (GDTR) ， 标 号 pgdt 所 指向 的 内 存 位 置 包 
含 了 GDT 的 基地 址 和 大 小 。 现 在 ， 我 们 的 任务 是 重新 从 标号 pgdt 处 取得 
GDT 的 基地 址 ， 为 其 添加 拉 述 符 ， 并 修改 它 的 大 小 ， 然 后 用 lgdt 指令 重 
新 加 载 一 裔 GDTR 寄存 器 ， 使 修改 生效 。 


但 是 ， 如 果 忽 略 了 一 件 事 ， 你 可 能 不 会 得 偿 。 标 号 pgdt 所 指 问 的 内 
存 区 域 位 于 主 引 导 程 序 内 ， 而 我 们 当前 正在 你 护 模 式 下 执行 主 引 导 程 
厅 。 你 护 模 式 下 的 代码 段 只 是 用 来 执行 的 ， 是 人 耕 能 读 出 ， 了 取决 于 其 摘 述 
符 的 类 别 字 段 ， 但 无 论 如 何 它 都 不 能 写 入 。 

对 代码 段 实施 保护 的 意思 是 通过 代码 段 搬 述 符 不 能 修改 段 中 的 内 
容 ， 但 不 意味 痢 通过 其 他 描述 符 做 不 到 。 想 想 看 ， 我 们 拥有 一 个 指 癌 全 
部 4GB 内 存 空 间 的 描述 符 ， 标 号 pgdt 所 指向 的 内 存 位 置 不 单单 是 在 主 引 
导 程序 内 ， 同 时 也 是 4GB 内 存 空间 的 一 部 分 。 

如 图 13-4 所 示 ， 标 号 pgdt 在 数值 上 等 于 它 距离 段 首 的 偏 移 量 ， 也 束 
是 编译 阶段 的 汇编 地 址 。 主 引导 程序 的 物理 起 始 地 址 是 0x00007C00， 故 
pgdt 在 4GB 段 内 的 偏 移 量 是 0x00007C00 十 pgdt。 


这 样 ， 为 了 得 到 GDT 的 基地 址 ， 代 码 清单 13-1 第 96 行 ， 使 用 了 指 





心 


mov esL [OXYc00Ttpodt+0x02] 


注意 ， 指 令 中 的 表达 式 是 在 编译 阶段 计算 的 。 默 认 的 段 寄 存 器 是 
DS， 当 这 条 指令 执行 时 ， 处 理 器 用 DS 描述 符 高 速 缓存 器 中 的 32 位 线性 
基地 址 0x00000000 加 上 用 该 表达 式 计算 出 的 偏 移 量 来 访问 内 存 。 

现在 可 以 创建 与 内 核 相 关 的 其 他 段 描 述 符 。 首 先是 公共 例 程 段 。 如 
图 13-5 所 示 ， 内 核 头 部 偏 移 0x04 处 的 一 个 双 字 ， 就 是 公共 例 程 段 的 起 始 
汇编 地 址 。 由 于 内 核 被 加 载 的 物理 地 址 是 由 EDI 寄存 器 指向 的 ， 所 以 ， 
第 99 行 ， 直 接 访问 4GB 内 存 段 ， 从 该 偏 移 位 置 取出 公共 例 程 段 的 起 始 汇 
编 地 址 。 


FFFEFEFEFRF 


pg2dt 
00007C00 


7C00 





00000000 


图 13-4 通过 4GB 数据 段 访问 代码 段 内 的 数据 


内 核 入 口 点 〈 段 : 偏 移 ) 
十 10 


_ 内 核 代 码 段 起 始 汇编 地 址 
十 0C 
内 核 数 据 段 起 始 汇编 地 址 
十 08 
公共 例 程 段 起 始 汇编 地 址 
十 04 
EDI 一 内 核 加 载 地 址 一 > 让 核 忆 你 度 





图 13-5 ”内 核 头 部 的 组 成 


创建 描述 符 还 需要 知道 段 界限 。 在 内 核 中 ， 各 个 段 有 着 确定 的 先后 
次 序 ， 而 且 是 案 摊 看 有 的。 公共 例 程 段 的 后 面 是 内 核 数 据 段 ， 用 内 核 数 据 
段 的 起 始 汇 编 地 址 ， 减 去 公共 例 程 段 的 起 始 汇编 地 址 ， 再 减 去 一 ， 殊 是 
公共 例 程 段 的 段 界 眼 ， 这 就 是 第 100 一 102 行 所 做 的 工作 。 对 于 向 上 扩展 
的 段 来 说 ， 有 段 界 限 在 数值 上 等 于 段 的 长 度 减 去 一 ， 这 个 必须 要 清楚 。 

第 103 行 ， 用 公共 例 程 段 的 起 始 汇编 地 址 ， 加 上 内 核 的 加 载 地 址 ， 
就 是 公共 例 程 段 的 基地 址 。 

在 已 经 知道 某 个 内 存 段 的 细节 时 ， 写 出 它 的 摘 述 符 是 很 容易 的 。 比 
如 ， 如 果 已 经 知道 栈 的 基地 址 是 0x00007C00 ， 粒 度 是 4KB， 大 小 是 
8KB， 那 么 ， 它 的 摘 述 从 就 可 以 直接 给 出 : 


0X00CEF96007C00EFEFD 


问题 是 ， 这 种 清楚 明日 的 情形 不 党 见 。 在 特 分 之 九 十 以 上 的 场合 ， 
段 的 信息 只 有 在 程序 运行 的 时 候 才 能 确定 ， 它 们 部 是 在 程序 运行 时 ， 根 


据 实 际 情 况 得 到 的 随机 值 。 为 此 ， 束 需要 利用 指令 来 以 不 变 应 万 变 ,，“ 拼 
凑 " 出 摘 述 符 来 。 

既然 是 灵活 的 方法 ， 还 能 以 不 变 应 万 变 ， 束 应 该 定 义 成 过 程 ， 以 方 
便 在 需要 的 时 候 随 时 调用 。 在 这 里 ， 我 们 的 方法 是 使 用 过 程 
make gdt descrlptor。 

过 程 make_gdt descriptor 位 于 代码 清单 13-1 的 195 一 217 行 ， 调 用 
该 过 程 需 要 三 个 参数 ， 分 别 是 段 的 线性 基地 址 、 段 界限 和 段 的 属性 值 。 
段 的 基地 址 用 EAX 寄存 器 传 入 ; 段 界限 用 EBX 寄存 需 传 入 ， 但 只 用 其 低 
20 位 ; 段 属 性 用 ECX 寄存 右 传 入 ， 各 属性 位 在 ECX 寄存 器 中 的 分 布 和 
它们 在 摘 述 符 高 32 位 中 的 时 候 一 样 ， 其 他 和 段 属性 无 天 的 位 都 清 零 。 

因此 ， 第 104 行 ， 将 段 属性 值 0x00409800 传送 到 ECX 寄存 器 。 结 
合 第 11 章 的 图 11-4， 可 以 知道 ， 这 是 一 个 P=1、D==1、G= 二 0、DPL= 
0、S= 二 1，TYPE 二 1000 的 《代码 ) 段 摘 述 符 。 第 105 行 ， 调 用 过 程 创 建 
接 述 从 ， 下 面 来 看 看 上 其 体 的 创建 过 程 。 


代码 清单 13-1 的 第 201 一 203 行 用 于 构造 描述 符 的 低 32 位 。 首 先是 
将 32 位 段 基 地 址 从 EAX 寄存 亏 复 制 一 份 给 EDX 寄存 右 ， 过 一 会 儿 构 造 
描述 符 的 高 32 位 时 ， 还 要 用 到 基地 址 。 

描述 符 的 低 32 位 中 ， 高 16 位 是 基地 址 ; 低 16 位 是 段 界限 ， 所 以 ， 
第 202 一 203 行 ， 将 EAX 寄存 器 中 的 32 位 基地 址 左 移 16 次 ， 使 基地 址 部 
分 束 位 。 然 后， 把 BX 寄存 需 中 的 段 界 限 用 or 指令 安排 就 位 。 这 样 ， 朱 述 
从 的 低 32 位 束 构 造 完毕 了 。 

相 比 之 下 ， 描 述 符 的 高 32 位 构造 起 来 比较 厅 烦 。 如 图 13-6 所 示 ， 挡 
述 符 高 32 位 的 标准 形态 是 有 两 个 基地 字段 和 一 个 段 界限 字段 。 其 地址 在 
EDX 寄存 器 中 有 备份 ， 执 行 第 205 一 207 行 的 指令 后 ， 会 使 基地 址 部 分 
在 两 边 就 位 。 


描述 符 高 32 位 的 标准 形态 《基地 址 和 界限 ) 





EDX 寄存 需 的 最 初 内 容 


段 基 地 址 31 一 0 


and edx,0xffff0000 执 行 后 : 


rol edx, 8 执行 后 : 





bswap edx 执 行 后 : 





xor bx, bx 执行 后 


人 ee 本 玫 和 人 和 必 


图 13-6 ”描述 符 高 32 位 的 构造 过 程 


bswap 是 字 节 交换 指令 (Byte Swap) ， 在 标准 的 32 位 处 理 器 上 只 
允许 32 位 的 寄存 占 操 作 数 ， 其 格式 为 


bswap r32 


处 理 器 执行 该 指令 时 ， 才 程 操作 (DEST 是 指令 中 的 操作 
数 ，TEMP 是 处 理 需 内 的 临时 寄存 器 


TEME = DESL 


DBRSTIY0l — TEMPISL:24] 

DESTILS28]) = TEMPI2Z3:16061> 

DESTIZ3216| <= TRMBPI1LSO: 8 
[ 


DESTL31324| < TEMPLY*0]> 


接 下 来 ， 要 在 摘 述 符 的 高 32 位 中 装配 段 界限 字段 。 第 209、210 
行 ， 先 清除 EBX 寄存 器 的 低 16 位 ， 然 后 同 EDX 寄存 器 合并 。 这 里 是 假 
设 EBX 寄存 医 的 高 12 位 为 全 零 ， 所 以 用 了 xor bx，bx 指 令 。 实 际 上 ， 安 
全 的 做 法 是 使 用 指令 

and ebx,0x000f0000 最 后 ， 第 212 行 ， 将 ECX 寄存 器 中 的 段 属 性 与 
EDX 寄存 器 中 的 描述 符 高 32 位 合并 。 至 此 ， 我 们 就 在 EDX:EAX 中 得 到 
了 完整 的 64 位 摘 述 符 。 第 214 行 ，ret 指令 将 控制 返回 到 调用 者 。 

现在 ， 回 到 主 程序 ， 来 看 第 106、107 行 ，ESI 寄存 器 的 内 容 是 GDT 
的 基地 址 ， 这 两 条 指令 访问 4GB 的 段 ， 定 位 到 GDT， 在 原先 的 基础 上 ， 
再 添加 一 个 描述 符 ， 惑 是 我 们 刚刚 创建 的 描述 符 。 

第 110 一 129 行 ， 用 于 安装 内 核 数据 段 和 内 核 代 码 段 的 描述 符 ， 也 采 
用 了 相同 的 过 程 ， 不 再 一 一 讲解 。 


第 131 行 ， 通 过 4GB 的 数据 段 访问 pgdt， 修 改 它 的 界限 信 。 现 在 ， 
GDT 中 己 经 有 8 个 描述 符 ， 故 其 总 长 度 为 64 字 市 。 相 应 地 ， 界 限 值 为 
6063。 


第 133 行 ， 通 过 4GB 的 数据 段 访问 pgdt， 重 新 加 载 GDTR， 使 上 面 
那些 对 GDT 的 修改 生效 。 


至 此 ， 内 核 已 经 全 部 加 载 完 毕 ， 图 13-7 是 内 核 加 载 完 成 之 后 的 GDT 
布局 。 

第 136 行 ， 通 过 4GB 的 数据 段 访 问 内 核 的 头 部 ， 用 间接 远 转 移 指令 
从 给 定 的 入 口 进入 内 核 执行 。 观 察 图 13-5， 再 参考 代码 清单 13-2 就 可 以 
明白 ， 在 内 核 头 部 偏 移 0x10 处 ， 是 6 字 节 的 内 核 入 口 点 。 前 面 是 32 位 的 
段 内 偏 移 地 址 ， 后 面 是 16 位 的 段 选择 子 ， 指 同 内 核 代 码 段 。 在 这 里 ， 段 
选择 子 和 直接 使 用 固定 的 数值 不 是 一 个 好 主意 ， 怕 的 是 往 后 内 核 有 重大 调 
整 时 ， 会 改变 描述 符 的 次 序 。 在 这 种 情况 下 ， 如 果 别 处 改 了 ， 这 里 未 了 
修改 ， 吏 一 定 会 出 现 问 题 。 


“ll 


核心 代码 段 〈 位 于 核心 数据 段 之 后 ) 


核心 数据 段 〈 位 于 系统 公用 例 程 段 之 后 》 


公用 例 程 段 〈 起 始 地 址 为 00040000 ) 
文本 模式 显存 (000B8000 一 000BFFFF ) 


图 13-7 ”内 核 加 载 完成 后 的 GDT 布局 





描述 符 索 引 


0x38 


0x30 


0x28 


0x20 


Ox18 


Ox10 


0x08 


0x00 


13.3 在 内 核 中 执行 


现在 转 到 代码 清单 13-2， 这 是 内 核 的 主体 部 分 。 

从 主 引 导 程 序 转 移 到 内 核 之 后 ， 人 处 理 右 会 从 第 532 行 开始 执行 ， 
为 这 里 是 内 核 的 入 口 。 

第 532、533 行 ， 初 始 化 段 寄 存 嚣 DS， 使 它 指 问 内 核 数 据 段 。 然 
后 ， 第 535、536 行 ， 调 用 公共 例 程 段 内 的 一 个 过 程 来 显示 字符 串 。 该 
call 指令 属于 直接 远 转 移 ， 指 令 中 给 出 了 公共 例 程 段 的 选择 子 和 段 内 偏 移 
量 。 字 符 串 是 在 第 362 行 ， 用 标号 message 1 声明 ， 并 初始 化 了 一 段 文 
字 ， 意 思 是 “如 果 你 看 到 这 段 信息 ， 那 么 这 意味 着 我 们 正在 保护 模式 下 运 
行 ， 内 核 已 经 加 载 ， 而 且 显 示例 程 工作 得 也 很 完美 。” 


显示 例 程 put_string 位 于 公共 例 程 段 内 ， 是 在 第 37 行 定义 的 。 基 本 
上 上， 它 的 代码 组 成 和 工作 原理 都 和 从 前 一 样 ， 但 也 有 不 同 之 处 。 前 完 ， 
这 里 的 代码 是 32 位 模式 的 ， 字 人 符 串 的 地 址 由 DS:EBX 传 入 ， 过 程 返回 时 
用 retf 指令 ， 而 不 是 ret。 这 意味 看 ， 必 须 以 远 过 程 调 用 的 方式 使 用 它 。 


和 往常 一 样 ，put_string 在 内 部 调用 了 男 一 个 过 程 put_char。 注 意 ， 
第 110 一 113 行 ，movsd 用 于 在 两 个 内 存 区 域 间 传送 双 字 数据 〈 一 次 传送 
4 字 节 ) 。 不 管 是 movsb， 还 是 movsw， 抑 或 是 movsd， 在 16 位 模式 
和 下， 是 把 由 DS:SI 指定 的 源 操 作 数 传送 到 由 ES:DI 指定 的 目的 地 。 但 是 ， 
在 32 位 模式 下 ， 产 和 目的 则 分 别 是 DS:ESI 和 ES:EDI。 

再 回 到 539 行 ， 下 面 的 工作 是 显示 处理 器 品牌 信息 。 

处 理 鼎 的 功能 是 强劲 的 ， 这 个 没有 人 怀疑 。 同 时， 在 处 理 右 内 部 也 
隐藏 着 太 多 的 秘密 ， 除 了 处 理 器 的 型 写 ， 还 有 大 量 的 特性 信息 ， 比 如 高 
速 绥 存 的 数量 、 是 否 具 备 温度 和 电源 省 理 功能 、 他 辑 处 理 厦 的 数量 、 贺 
级 可 编程 中 断 控制 器 的 类 型 、 线 性 〈 物 理 ) 地 址 的 宽度 、 是 否 具 有 多 媒 
体 扩 展 和 单 指 令 多 数据 指令 等 特性 。 

处 理 器 功能 强 了 是 好 事 ， 大 家 痢 很 欢喜 。 有 麻烦 在 于 ， 很 多 新 功能 是 
处 理 堪 更 新 换代 的 产物 ， 只 存在 于 最 新 的 版 本 中 ， 旧 的 处 理 堪 疫 有 。 比 
如 多 媒体 扩展 指令 可 以 加 速 多 媒体 的 处 理 速 度 ， 但 用 了 新 指令 的 软件 不 
能 运行 在 上 日 的 处 理 右 上 ， 因 为 它们 不 文 持 。 可 由 之 处 在 于 ， 没 有 人 知道 


目 己 的 软件 被 终 刀 销售 商 卖 给 了 谁 ， 更 不 知 直 那个 谁 用 的 是 什么 处 理 


五 o 

因此 ， 你 的 软件 应 当 准 备 两 仁 方 案 ， 而 且 ， 在 决定 使 用 哪 父 方案 之 
前 ， 必 须 探 测 和 挖掘 处 理 器 内 部 的 秘密 ， 好 知道 该 怎么 办 。lntel 公司 显 
然 洞 悉 了 市 场 上 发 生 的 一 切 ， 它 们 给 出 的 方案 是 使 用 cpuid 指令 。 

cpuid 指令 (CPU Identification ) 用 于 返回 处 理 器 的 标识 和 特性 信 
恩 。EAX 用 于 指定 要 返回 什么 样 的 信息 ， 也 就 是 功能 。 有 有 时候， 还 要 用 
到 ECX 寄存 右 。cpuid 指令 执行 后 ， 处 理 亏 将 返回 的 信息 放 在 EAX、 
EBX、ECX 或 者 EDX 中 。 


cpuid 指令 是 从 80486 处 理 旨 的 后 期 版 本 开始 引入 的 ， 从 此 以 后 ， 
于 处 理 占 都会 对 可 以 返回 的 信息 有 所 扩充 。 原 则 上 ， 在 使 用 cpuid 指令 
六 ， 移 要 检测 处 理 需 是 人 否 文 持 访 指令 ;: 接 看 再 用 cpuid 指令 检测 是 否 文 持 
所 需要 的 功能 。 

如 图 13-8 所 示 ， 在 32 位 处 理 器 上 ， 原 先 的 标志 寄存 器 FLAGS 也 相 
应 地 扩充 到 了 32 位 ， 以 支持 更 多 的 标志 。 扩 充 之 后 的 标志 寄存 右 称 为 
EFLAGS 寄存 器 ， 它 的 ID 标志 位 《位 21) 如 果 为 “0”"， 则 不 支持 cpuid 指 
令 ; 反之 ， 该 处 理 器 支持 cpuid 指令 。80486 处 理 器 已 经 很 久远 了 ， 我 想 
没有 谁 还 在 使 用 这 样 的 计算 机 ， 况 且 它 已 经 停产 。 一 般 情况 下 ， 不 需要 
检测 处 理 器 是 否 支 持 cpuid 指令 。 





图 13-8 扩展 到 32 位 长 度 的 标志 等 存 融 EFLAGS 


图 13-8 中 ， 灰 色 的 部 分 是 保留 位 ， 通 常设 置 为 固定 的 值 。EFLAGS 
还 包括 更 多 的 标志 位 ， 图 中 未 予 显 示 ， 仅 在 以 后 用 到 的 时 候 一 一 介绍 。 
为 了 探 负 处 理 豆 最 大 能 够 文 择 的 功能 号 ， 应 该 先 用 0 号 功能 来 执行 
cpuld 指令 : 
moVv eax,0 


Couid 


处 理 器 执行 后 ， 将 在 EAX 寄存 器 返回 最 大 可 以 支持 的 功能 号 。 同 
时 ， 还 在 EBX、ECX 和 EDX 中 返回 处 理 器 供应 商 的 信息 。 对 于 Intel 处 理 


人 艇 来 议 ， 返 回 的 信息 如 下 : 


EBX < 0x756E6547 (对 应 字符 串 “Genu”%，“G” 在 BL 中 ， 其 他 类 推 ) 
EDX < 0x49656E69 (对 应 字符 早 “ineI”“i” 在 DL 中 ， 其 他 类 推 ) 
ECX < 二 0x6C65746E (对 应 字符 串 “ntel”,“n” 在 CL 中 ， 其 他 类 推 ) 


组 合 起 来 就 是 “Genuinelntel”。 


要 返回 处 理 右 的 品牌 信息 ， 需 要 使 用 0x80000002 一 0x80000004 号 
功能 ， 分 三 次 进行 。 注 意 ， 访 功能 仅 被 奔腾 4 (Pentium 4) 之 后 的 处 理 
器 支持 ， 所 以 ， 正 确 的 做 法 是 先 用 0 号 功能 执行 cpuid 指 令 ， 以 判断 自己 
的 处 理 器 是 否 支 持 。 代 码 清单 13-2 并 没有 这 样 做 ， 因 此 可 视 为 一 个 反面 
典型 。 


第 539 一 558 行 ， 分 别 用 三 种 功能 号 执行 cpuid 指令 ， 返 回 三 组 字符 
串 ， 共 48 个 字符 ， 依 次 保存 在 核心 数据 段 中 ， 起 始 位 置 是 由 标号 
cpu_brand 指定 的 。 第 381 行 ， 声 明了 标号 cpu_brand， 并 初始 化 了 52 
字 节 ， 足 以 容纳 这 些 数 据 。 

从 处 理 器 返回 的 数据 都 是 现成 的 ASCI 码 。 第 560 一 565 行 ， 先 在 屏 
幕 上 留 出 空 行 ， 再 显示 处 理 需 品牌 信息 ， 然 后 再 留 空 ， 以 突出 要 显示 的 
内 容 。 


13.4 用 户 程序 的 加 载 和 重 定位 


好 了 ， 现 在 我 们 可 以 开始 加 载 用 户 程序 了 。 

用 户 程序 加 载 之 前 ， 要 和 匈 显示 一 段 信 息 ， 意 思 十 要 加 载 用 户 程序 
了 。 这 是 第 567、568 行 的 工作 。 和 字符 串 位 于 内 核 数 据 段 中 ， 第 367 行 声 
明了 标号 message 5 并 初始 化 了 字符 串 。 

第 569 行 用 于 指定 用 户 程 序 的 起 始 馆 辑 面 区 号 。 在 指令 中 直接 指定 
数值 不 是 一 个 好 习惯 ， 正 确 的 做 法 是 用 伪 指 令 equ 声明 成 常数 ， 并 放 到 
整个 程序 的 起 始 部 分 以 便 修 改 。 

内 核 的 主要 任务 瓯 是 加 载 和 执行 用 户 程 序 。 通 第 情况 下 ， 这 样 的 工 
作 会 反复 进行 。 为 了 方便 ， 一 般 要 定义 成 可 反复 调用 的 过 程 。 在 这 里 ， 
我 们 也 是 这 样 做 的 ， 过 程 的 名 字 叫 load relocate_program 。 该 过 程 位 于 
第 387 行 ， 作 用 是 加 载 和 草 定 位 用 户 程 序 。 从 代码 清单 中 可 以 看 出 ， 它 
是 内 核 代 码 段 的 一 个 内 部 过 程 。 


13.4.1 用 户 程 序 的 结构 


用 户 程序 必须 符合 规定 的 格式 ， 才 能 被 内 核 识别 和 加 载 。 通 常情 况 
下 ， 流 行 的 操作 系统 会 规定 自己 的 可 执行 文件 格式 ， 一 般 都 比较 复杂 ， 
这 种 复杂 性 和 操作 系统 自身 的 复杂 性 是 息息相关 的 ， 

现在 转 到 代码 清单 13-3， 来 看 看 用 户 程序 的 结构 ， 

所 有 操作 系统 的 可 执行 文件 都 包括 文件 头 ， 这 里 也 不 例外 。 事 实 
上 ， 这 也 是 我 们 熟悉 的 、 一 贯 的 做 法 。 在 文件 头 内 的 偏 移 0 处 ， 是 一 个 双 
字 ， 指 示 了 用 户 程序 的 大 小 ， 以 字 节 为 单位 。 

偏 移 量 为 0x04 处 的 双 字 是 头 部 的 长 度 ， 以 字 节 为 单位 。 

偏 移 量 为 0x08 处 的 双 字 是 为 栈 保留 的 ， 和 早先 的 做 法 不 同 ， 内 核 不 
要 求 用 户 程序 提供 栈 空间 ， 而 改 由 内 核 动态 分 配 ， 以 减轻 用 户 程序 编写 
的 负担 。 当 内 核 分 配 了 栈 空间 后 ， 会 把 栈 段 的 选择 子 填写 到 这 里 ， 用 户 
程序 开始 执行 时 ， 可 以 从 这 里 取得 该 选择 子 以 初始 化 自己 的 栈 ; 


偏 移 量 为 0x0c 处 的 双 字 是 要 求 分 配 的 栈 大 小 ， 即 ， 用 户 程 序 编写 者 
建议 的 栈 大 小 ， 以 4KB 为 日 位 。 如 果 是 1， 就 是 布 望 分 配 4KB 的 栈 空间 ; 
如 有 果 是 2， 就 是 希望 分 配 8KB 的 栈 空间 ， 依 此 类 推 。 

俩 移 量 为 0x10 处 的 双 字 ， 是 用 户 程序 入 口 点 的 32 位 偏 移 地 址 。 


俩 移 量 为 0X14 处 的 双 衬 ， 古 用 户 程序 代 但 段 的 起 始 汇编 地 址 。 当 内 
核 完 成 对 用 户 程 序 的 加 载 和 重 定位 后 ， 将 把 该 段 的 选择 于 回填 到 这 里 
〈 仅 占用 低 宇 部分) 。 这 样 一 来 ， 它 和 0x10 处 的 双 字 一起， 共同 组 成 一 
个 6 衬 贡 的 入 口 点 ， 和 内核 从 这 里 转移 控制 到 用 户 程序 。 


偏 移 量 为 0x18 处 的 双 字 ， 征 用 户 程 序 代 码 段 的 长 度 ， 以 字 布 为 单 


位 。 


偏 移 量 为 0x1c 处 的 双 字 ， 有 是 用 户 程 序数 据 段 的 起 始 汇 编 地 址 ， 当 内 
核 完 成 用 户 程 序 的 加 载 和 重 定位 后 ， 将 把 该 段 的 选择 子 回填 到 这 里 《 仅 
占用 低 字 部 分 ) 。 


人 偶 移 量 为 0x20 处 的 双 字 ， 丰 用户 程 序数 据 段 的 长 度 ， 以 字 贡 为 音 


位 。 


除了 加 载 和 重 定位 用 户 程 序 外 ， 凡 核 还 应 当 近 供 一 坚 例 程 供用 户 程 
序 调用 。 控 作 系 统 对 于 普通 用 尸 来 说， 是 贤 心 悦目 的 雪 面 和 快捷 耳 观 的 
操作 方式 ， 对 程序 员 来 次 ， 则 是 一 个 巨大 的 例 程 库 ， 克 省 了 时 间 ， 减 少 
了 工作 量 ， 其 至 不 需要 百 接 访问 使 件 。 


操作 系统 提供 的 编程 接口 就 是 APl， 这 是 一 大 堆 例 程 (过程 》， 需 要 
的 时 候 下 接 调 用 即 可 。 问 题 在 于 ， 它 们 在 操作 系统 内 部 ， 对 任何 人 来 说 
都 古人 不 可 见 的 ， 更 别 想 知道 它们 的 入 口 地 址 。 但 是 ，call 指令 征 需要 直接 
或 间接 提供 一 个 地 址 的 。 为 一 方面 ， 即 使 你 知 刀 它们 的 地 址 ， 调 用 的 时 
候 也 有 风险 ， 因 为 操作 系统 也 需要 升级 换代 ， 这 些 地 址 可 能 改变 。 当 你 
的 程序 在 新 操作 系统 上 工作 时 ， 婚 要 出 问题 。 


为 了 使 开 肥 人 员 能 够 利用 它 所 提供 的 APl， 操 a 作 系 统 全 少 要 公开 它 
们 。 在 早期 的 系统 中 ， 这 些 API 以 中 断 扣 的 方式 公布 ， 因 为 它们 是 通过 
软 中 渐进 入 的 。 不 过 ， 为 一 种 津 见 的 办 法 是 使 用 从 写 名 。 比 如 ， 操 作 系 
统 提 供 了 一 个 例 程 ， 用 于 显示 光标 跟随 的 字符 串 ， 那 么 ， 它 可 以 公布 一 
个 从 写 名 : 


PrintStreing 


当然 ， 它 肯定 不 会 同时 公布 一 个 段 地 址 和 偏 移 地 址 ， 因 为 它 也 不 能 
保证 地 址 不 会 变化 。 在 操作 系统 的 开 友 手册 中 ， 会 列 出 所 有 符 写 名 。 符 
号 名 在 局 级 语言 里 融 是 库 函 数 名 。 

加 到 代码 清单 13-3 中 来 。 


内 核 要 求 ， 用 户 程 序 必须 在 涉 部 偏 移 量 为 0x28 的 地 方 构造 一 个 表 
格 ， 并 在 表格 中 列 出 所 有 要 用 到 的 符号 名 。 每 个 从 号 名 的 长 度 是 256 字 
节 ， 不 足 部 分 用 0x00 填充 ， 这 意味 着 每 个 从 号 名 的 长 度 最 多 可 以 是 256 
个 字 和 人生。 在 用 户 程 序 加 载 后 ， 内 核 会 分 析 这 个 表格 ， 并 将 每 一 个 符号 名 
蔡 换 成 相应 的 内 存 地 址 ， 这 就 是 过 程 的 重 定 位 。 为 了 方便 起 见 ， 我 们 把 
该 表格 叫做 “符号 -地 址 检索 表 ”( Symbol-Address Lookup Table ， 
SALT) 。 不 要 上 网 搜索 这 个 词 ， 也 不 要 查 别 的 资料 ， 这 不 是 一 个 标准 ， 
是 我 自己 随心 所 欲 、 特 立 独行 的 产物 。 

第 29 一 36 行 声明 了 三 个 标号 ， 并 分 别 初 始 化 了 三 个 符号 名 ， 每 一 个 
256 字 节 ， 不 足 部 分 是 用 0 填充 的 。 每 个 符号 名 都 以 “@” 开 始 ， 这 并 没有 
任何 特殊 意义 ， 仪 仅 在 概念 上 用 于 表示 “接口 "的 意思 。 为 了 计算 需要 填充 
多 少 个 0， 它 们 痢 使 用 了 相似 的 表达 式 ， 比 如 : 


times 256=(S=PrintString) db 0 


这 里 ， 先 计算 出 从 号 名 的 实际 字符 数 ， 即 $-PrintString， 再 用 256 减 
去 实际 字 侍 数 ， 束 得 到 了 伪 指 令 db 的 重复 次 数 。 

SALT 表 可 大 可 小 ， 内 核 需要 知道 它 在 哪里 结束 。 第 26 行 ， 用 于 初 
始 化 SALT 表 的 项 数 ， 也 就 是 符号 名 的 数量 ， 它 是 用 表格 的 总 长 度 除 以 每 
个 符号 名 的 长 度 (256) 得 到 的 。 

事实 上， 即使 是 大 多 数 汇 编 语 言 ， 也 不 需要 杀 目 构造 文件 头 ， 那 是 
链接 如 (Linker)〉 的 工作 。 但 是 ， 链 接 喜 是 为 流行 的 操作 系统 服务 的 ， 用 
于 构造 他 们 可 以 识别 的 可 执行 文件 格式 。 我 们 不 想 把 问题 搞 得 太 复 林 ， 
束 本 书 的 扁 幅 和 宗旨 来 说 ， 迎 合 "流行 ?所 要 花费 的 代价 实在 太 大 ， 管 中 括 
鹏 、 点 到 即 止 不 是 很 好 吗 ”? 


13.4.2 ”计算 用 户 程序 占用 的 扇 区 数 
再 次 回 到 代码 清单 13-2。 


用 户 程序 的 加 载 是 在 例 程 load_relocate_program 内 进行 的 ， 该 过 程 
需要 用 ESI 寄存 右 传 入 用 户 程 序 的 起 始 效 辑 届 区 写 。 妆 过 程 返 回 时 ， 在 
AX 富生 莫 内 包含 了 指 问 用 户 尖 部 段 的 选择 子 ，。 

第 396、397 行 ， 因 为 在 过 程 中 要 用 到 DS 和 ES， 故 将 其 原先 的 内 容 
压 栈 傈 存 。 


为 了 得 到 用 户 程序 的 大 小 ， 需 要 先 预 谈 它 的 第 一 个 面 区， 第 399 一 
404 行 束 在 做 这 件 事 。 首 先 ， 使 段 盏 和 存 占 DS 指 同 内 核 数 据 段 ; 然后 ， 调 
用 庶 便 往 的 过 程 read_hard disk_0 来 预 谈 用 户 程 序 。 进 入 过 程 衣 ，EAX 
寄存 右 的 内 容 是 用 户 程序 的 起 始 馆 辑 忆 区 号 ; 数据 的 存放 地 点 是 内 核 组 
冲 区 core_buf， 它 位 于 内 核 数 据 段 中 ， 是 在 第 376 行 声 明和 初始 化 的 。 在 
内 核 中 开辟 出 一 段 固定 的 空间 ， 对 于 分 机、 加 工 和 中 转 数 据 都 比较 方 
便 。 


接 下 来 的 工作 是 计算 用 户 程序 到 展 占 用 了 多 少 个 而 区 。 用 户 程序 的 
总 大 小 就 在 头 部 内 偏 移 量 为 0x00 的 地 方 ， 因 此 ， 第 407 行 直接 访问 内 核 
绥 冲 区 取得 这 个 双 字 。 


用 户 程序 的 大 小 〈 恕 字 布 数 ) 不 一 定 恰 好 十 512 的 整数 僧 。 也 残 是 
说 ， 最 后 一 个 山区 未 必 是 满 的 。 因 此 ， 如 果 直 接 除 以 512， 可 能 会 使 结 
(除法 的 丙 ) 比 实际 的 珊 区 数 少 一 。 通 第 情况 下 ， 需 要 判断 际 法 的 余 
数 ， 根 据 余 数 是 否 为 零 ， 来 次 定 实际 的 面 区 总 数 ， 这 不 可 如 免 地 要 使 用 
判断 和 条 件 转移 指令 。 


在 早先 的 处 理 需 中 ， 转 移 指令 是 影响 处 理 需 速度 的 重大 因素 之 一 ， 
因为 它 会 使 流水 线 中 那些 已 经 预 取 和 译 码 的 指令 失效 。 在 较 晚 的 处 理 器 
中 ， 普 明 采 用 了 分 文 预测 技术 ， 但 并 不 总 能 保证 预测 是 准 的 。 因 此 ， 最 
好 的 办 法 就 是 尽量 不 使 用 转移 指令 。 为 了 帮助 程序 员 部 分 地 戒 掉 使 用 转 
移 指令 的 欲望 ， 处 理 嚣 引入 了 条 件 传送 指令 cmovcc。 

cmovcc 指令 是 从 P6 处 理 强 族 开 始 引 入 的 ， 因 此 并 非 所 有 处 理 帮 部 
文 持 它 。 如 果 你 想 知 道 确 切 的 结果 ， 可 以 先 以 1 号 功能 执行 cpuid 指令 : 


mov eax,l 


EpUuld 


当 处 理 器 执行 这 两 条 指令 后 ， 会 在 EBX、ECX 和 EDX 寄存 器 返回 丰 
富 的 信息 ， 以 指示 各 种 详尽 的 处 理 器 特性 。 此 时 ， 检 查 EDX 寄存 器 的 第 
16 位 (bit 15) ， 当 它 是 “1 时 ， 表 明 处 理 器 支持 cmovcc 指令 。 


条 件 转移 指令 和 传达 指令 相 结合 的 产物 ， 既 有 条 件 转移 指令 的 多 样 
性 ， 又 执行 的 是 传送 操作 。 但 是 ， 和 moyv 指令 不 同 的 是 ， 它 的 目的 操作 
数 只 允许 是 16 位 或 者 32 位 通用 寄存 闫 ， 源 操作 数 只 能 是 相同 宽度 的 通用 
寄存 规 和 内 存单 元 ， 以 下 是 儿 个 种 用 的 例子 : 


Tv oo ;为 零 则 传送 
cmovnz eax, [0x2000] ;不 为 零 则 传送 
cmove ebx,ecx : 相等 则 传送 
cmovng cx, [0x1000] ; 不 大 于 则 传送 
CImOVJT edx,ecx :小 于 则 传送 


条 件 传送 指令 是 很 多 的 。 在 第 6 章 的 表 6-1 中 ， 列 举 了 所 有 的 条 件 转 
移 指令 。 完 整 的 cmovcc 指 令 列 表 ， 可 以 在 表 6-1 的 基础 上 ， 将 那些 指令 
的 首 字母 了 换 成 "cmov " 即 可 。 


cmovcc 指令 不 影响 EFLAGS 寄存 右 中 的 任何 标志 位 。 相 有 反 地 ， 它 
的 执行 过 程 要 依赖 于 这 些 标 志 ， 束 像 条 件 转 移 指令 一 样 。 

言 归 正 传 ,为 了 不 使 用 条 件 转 移 指令 而 义 能 算出 用 户 程序 实际 占用 
的 面 区 数 ， 需 要 一 点 技巧 。 考 穴 一 下 ， 你 发 会 现 ， 所 有 能 被 512 整除 的 
数 ， 其 最 低 端 的 9 个 比特 都 是 "0”"。 比 如 : 


0x200〈 对 应 的 十 进 制 数 为 512) -> 0000 0010 0000 0000B 
0x400〈 对 应 的 十 进 制 数 为 1024) -> 0000 0100 0000 0000B 
0x600【〔 对 应 的 十 进 制 数 为 1536) -> 0000 0110 0000 0000B 
0x800〈 对 应 的 十 进 制 数 为 2048) -> 0000 1000 0000 0000B 
0xE00〈 对 应 的 十 进 制 数 为 3584) -> 0000 1110 0000 0000B 


很 好 ， 第 408 行 ， 将 用 户 程序 的 总 大 小 从 EAX 寄存 器 传送 到 EBX 寄 
存 器 ， 等 于 是 做 个 备份 ， 因 为 后 面 还 要 用 到 ; 第 409、410 行 ， 先 用 and 
指令 将 其 最 低 的 9 个 比特 清 零 ， 等 于 是 去 挥 那 些 不 足 512 的 零头 ， 然 后 ， 
再 将 其 加 上 512， 等 于 是 将 那些 零头 竣 整 。 

但 是 ， 奉 人 家 原本 就 是 512 的 整数 倍 ， 你 这 么 做 无 疑 是 多 加 了 一 个 
而 区 。 因 此 ， 第 411、412 行 ， 先 测试 EAX 寄存 器 的 最 低 9 个 比特 ， 如 果 
测试 的 结果 是 它们 不 全 为 零 ， 则 采用 诸 你 的 结果 ;: 如 果 为 全 零 ， 则 
cmovcc 指令 什么 也 不 做 ， 依 然 采 用 用 户 程序 原本 的 长 度 值 。 


13.4.3 ”简单 的 动态 内 存 分 配 


下 面 的 工作 是 把 用 户 程序 从 硬盘 上 读 到 内 存 中 。 我 们 以 前 的 做 法 是 
站 定 一 个 区 域 ， 比 如 物理 地 址 0x100000， 然 后 把 程序 加 载 到 那里 。 如 果 
要 加 载 的 程序 很 多 ， 这 就 会 成 为 一 种 需要 仔细 规划 的 工作 ， 每 个 程序 加 
载 到 哪里 ， 都 需要 一 一 指定 。 

在 流行 的 操作 系统 里 ， 内 存 管理 是 一 项 重要 而 又 严肃 的 工作 ， 不 用 
说 也 相当 复 洒 。 它 要 记 住 所有 可 以 分 配 的 内 和 存 ， 将 它们 分 成 块 。 这 样 ， 
当 要 求 分 配 内 存 时 ， 内 存 管理 程序 将 奏 找 并 分 配 那 些 大 小 相符 的 空 朵 
块 ， 当 占用 这 些 块 的 用 尸 终止 执行 后 ， 还 要 人 负 贡 回收 它们 ， 以 便 再 用 于 
分 配 ; 当 内 存 空间 案 张 ， 找 不 到 空 几 块 ， 或 者 空 用 块 的 大 小 不 能 满足 震 
求 时 ， 内 存 管 理 程序 还 要 负责 奏 找 那些 很 少 被 访问 的 块 ， 将 其 中 的 数据 
移 到 硬盘 上 ， 腾 出 空间 来 满足 当前 的 需求 。 下 次 当 这 些 块 再 次 被 用 到 
时 ， 再 用 同样 的 办 法 从 硬盘 调 回 内 存 。 

讲 了 这 么 多 ， 你 可 能 以 为 我 们 现在 束 要 写 一 个 内 存 官 理 程序 。 不 ， 
不 会 的 ， 这 不 太 现 实 。 束 我 们 目前 的 需求 来 说， 只 需要 一 个 简单 的 内 存 
分 配 程 序 就 可 以 了 ， 这 就 是 allocate_memory 例 程 。 

allocate_memory 例 程 位 于 代码 清单 13-2 的 公共 例 程 段 中 ， 生 仅仅 
需要 通过 ECX 寄存 器 传 入 希望 分 配 的 字 节 数 。 当 过 程 返 回 时 ，ECX 寄存 
大 包 售 了 所 分 配 内 存 的 起 始 物理 地 址 。 


allocate_memory 的 内 存 分 配 稼 略 非 营 简 单 。 请 看 代码 清单 13-2 的 
第 335 行 ， 在 内 核 数 据 段 中 声明 了 标号 ram_alloc， 并 初始 化 为 一 个 双 字 
0x00100000， 这 就 古 可 用 于 分 配 的 初始 内 存 地 址 。 很 显然 ， 这 个 位 置 正 
好 在 1MB 之 外 。 每 次 请 求 分 配 内 存 时 ，allocate_ memory 过程 仅 简单 地 
返回 该 内 存单 元 的 值 ， 作 为 所 分 配 内 存 的 起 始 地 址 。 同 时 ， 将 这 个 值 加 
上 所 分 配 的 长 度 ， 作 为 下 次 分 配 的 起 始 地 址 写 回 该 内 存 蛙 元。 

因此 ， 在 进行 了 必要 的 现场 压 栈 体 护 之 后 ， 第 239 一 247 行 ， 先 使 段 
寄存 颖 DS 指 癌 内 核 数 据 段 以 访问 标号 ram_alloc 所 指 癌 的 内 存单 元 ; 然 
后 ， 计 算 下 次 可 用 于 分 配 的 起 始 内 存 地 址 并 存放 到 EAX 寄存 左 中 ;， 最 
后 ， 在 ECX 中 得 到 本 次 分 配 到 的 起 始 内 存 地 址 ， 这 个 值 将 返回 给 调用 
者 。 当 然 ， 在 这 个 过 程 中 没有 检测 是 否 超越 了 实际 拥有 的 物理 内 存 。 我 
们 的 程序 都 非常 小 ， 现 在 哪 台 计 算 机 没有 几 十 兆 、 几 百 兆 其 至 几 个 吉 的 
内 存 呢 ? 


原则 上 ， 将 EAX 寄存 器 中 的 值 写 回 ram_alloc 所 指 癌 的 双 字 单元 即 
可 。 不 过 ，32 位 的 计算 机 系统 建议 内 存 地 址 最 好 是 4 字 节 对 齐 的 ， 这 样 


做 的 好 处 是 访问 速度 最 快 。 为 此 ， 在 将 EAX 寄存 器 的 值 写 回 内 存 之 前 ， 
最 好 使 之 成 为 可 被 4 整除 的 值 ， 这 种 数值 的 特点 是 最 低 两 个 比特 为 “0”。 

第 249 一 254 行 ， 先 将 EAX 寄存 器 的 内 容 传 送 到 EBX 进行 备份 1 接 
着 ， 强 制 EBX 中 的 地 址 对 齐 在 下 一 个 4 字 节 边界 ， 对 齐 之 后 的 值 肯 定 会 
比 原先 大 ; 然后 ， 看 一 看 原始 分 配 的 起 始 地 址 (在 EAX 寄存 嚣 中) 是否 
是 4 字 节 对 齐 的 ， 如 果 不 是 ， 就 采用 对 齐 之 后 的 值 ;， 如 果 原 本 就 是 4 字 节 
对 齐 的 ， 那 么 ， 依 然 采用 原 值 ， 最 后 ， 将 这 个 值 写 回 到 原 内 存单 元 中 ， 
作为 下 次 内 存 分 配 的 起 始 地 址 。 

过 程 allocate_memory 是 用 retf 指令 返回 的 。 因 此 ， 它 只 能 通过 远 过 
程 调 用 来 进入 。 


13.4.4 段 的 重 定 位 和 摘 述 符 的 创建 


接着 回 到 |load_relocate program 过 程 。 


在 13.4.2 节 里 ， 我 们 算出 了 用 户 程序 的 总 长 度 ， 而 且 已 经 被 调整 为 
可 以 被 512 整除 的 数 。 第 414 、415 行 ， 用 这 个 数值 去 调用 
allocate_memory 过 程 分 配 内 存 。 分 配 到 手 的 内 存 块 ， 起 始 地 址 在 ECX 
寄存 器 中 。 

第 416 行 ， 将 ECX 寄存 堪 的 内 容 传达 到 EBX， 其 动机 是 作为 起 始 地 
址 从 硬盘 上 加 载 整个 用 户 程 序 。 

第 417 行 ， 将 该 首 地 址 压 栈 你 存 ， 其 目的 是 用 于 在 后 面 访问 用 户 程 
序 头 部 。 

第 418 一 420 行 ， 用 户 程 序 的 总 长 上 度 除 以 512， 得 到 它 所 占用 的 届 区 

第 421 行 ， 将 证 区 数 传 送 到 ECX 寄存 器 ， 用 于 控制 后 面 的 循环 次 
数 。 该 循环 是 用 来 加 载 整个 用 户 程序 的 。 

第 423、424 行 ， 使 段 寄 存 器 DS 指向 4GB 的 内 存 段 ， 这 样 束 可 以 加 
载 用 户 程序 了 。 

第 428 一 430 行 ， 循 环 谈 取 便 盘 以 加 载 用 户 程 序 。 访 取 的 识 数 由 ECX 
控制 ， 加载 之 前 ， 其 首 地 址 已 经 位 于 EBX 寄存 器 。 起 始 逻 辑 鹿 区 号 原本 
是 通过 ESI 寄存 器 传 入 的 ， 循 环 开始 之 前 已 经 传送 到 EAX 寄存 占 〈 第 426 

J 


既然 用 户 程序 已 经 全 部 读 入 内 存 ， 现 在 的 任务 惑 是 根据 它 的 头 部 信 
娠 来 创建 段 插 述 从 。 

第 433 行 ， 从 栈 中 弹出 用 户 程 序 首 地 址 到 EDI 寄存 人 葵 ， 它 是 在 表面 
第 417 行 压 入 的 ， 访 地 址 也 是 用 户 程 序 关 部 的 起 始 地 址 。 


第 434 一 438 行 ， 谈 用 户 程序 头 部 信息 ， 根 据 这 些 信息 创建 头 部 段 摘 
述 从 。 在 主 引 导 程 序 里 ， 有 一 个 创建 摘 述 和 从 的 例 程 ， 在 内 核 中 ， 也 编写 
了 一 个 同样 的 例 程 make seg _descriptor， 甚 至 它们 所 用 的 指令 都 一 模 一 
样 。 它 属于 公共 例 程 段 ， 是 在 第 308 行 定 义 的 。 

该 过 程 要 求 用 EAX 寄存 嚣 传 入 段 的 基地 址 ， 这 是 第 434 行 的 工作 。 
段 界 限 由 EBX 寄存 器 传 入 ， 第 435、436 行 访问 4GB 内 存 段 ， 从 用 户 程 
序 涉 部 偏 移 0x04 处 取出 段 长 度 ， 减 一 后 形成 段 界 眼 。 第 437 行 用 于 给 出 
头 部 段 的 属性 值 。 

从 过 程 返回 时 ，EDX: EAX 中 包含 了 64 位 的 段 描述 符 。 索 接 痢 ， 第 
439 行 调 用 公共 例 程 段 内 的 男 一 个 过 程 sSet_up_gdt_descriptor， 把 该 描述 
符 安装 到 GDT 中 。 


set_up_gdt_descriptor 也 属于 公共 例 程 段 ， 是 在 第 263 行 定义 的 ， 
它 需 要 通过 EDX:EAX 传 入 描述 人 符 作 为 唯一 的 参数 。 该 过 程 返 回 时 ，CX 
寄存 器 中 包含 了 那个 摘 述 符 的 选择 子 。 

要 在 GDT 内 安装 描述 符 ， 必 须知 道 它 的 物理 地 址 和 大 小 。 而 要 知道 
这 些 信 息 ， 可 以 使 用 指令 sgdt (Store Global Descriptor Table 
Register) ， 它 用 于 将 GDTR 寄存 器 的 基地 址 和 边界 信息 保存 到 指定 的 内 
存 位 置 。sgdt 指令 的 格式 为 


sgdt m 


其 中 ，m 是 一 个 6 字 节 内 存 区 域 的 痛 地 址 。 该 指令 不 影响 任何 标志 
位 。 

第 332、333 行 ， 在 内 核 数 据 段 中 ， 声 明了 标号 pgdt， 并 初始 化 了 6 
字 节 ， 供 sgdt 指令 使 用 。 低 2 字 节 用 于 保存 GDT 的 界限 〈 大 小 ) ;高 4 
字 节 用 于 保存 GDT 的 32 位 物理 地 址 。 

回 到 例 程 set up_gdt_ descriptor 中 。 第 270 一 276 行 ， 在 压 栈 保存 了 


DS 和 ES 的 原始 内 容 后 ， 使 DS 指 同 内 核 数据 段 。 紧 接着 ， 使 用 sgdt 指 
令 取 得 GDT 的 基地 址 和 大 小 。 


第 278、279 行 ， 使 段 寄 存 器 ES 指向 4GB 内 存 段 以 操作 全 局 描述 符 
表 (GDT) 。 


下 面 的 工作 是 计算 描述 符 的 安装 地 址 。 这 个 地 址 可 以 这 样 计 算 : 先 
得 到 描述 符 表 的 界限 值 ， 将 它 加 一 ， 得 到 摘 述 符 表 的 总 字 贡 数 ， 这 实际 
上 也 是 新 描述 符 在 GDT 内 的 偏 移 量 。 然 后 ， 用 GDT 的 线性 地 址 加 上 这 个 
偏 移 量 ， 就 是 用 于 安 闭 新 描述 符 的 线性 地 址 。 

第 281 行 ， 先 访问 内 核 数 据 段 ， 取 得 GDT 的 界限 值 。 注 意 ， 这 里 出 
现 了 一 个 新 指令 movzx， 其 作用 是 市 零 扩 展 的 传达 (Move with Zero- 
Extend) ， 指 令 格式 为 


movexw TS ER 
movz 32, /m8 


mov2% £32 /M16 


也 束 古 襄 ，movzx 指令 的 目的 操作 数 只 能 是 16 位 或 者 32 位 的 通用 
寄存 此 ， 源 操作 数 只 能 是 8 位 或 者 16 位 的 通用 寄存 右 ， 或 者 指 同 一 个 8 位 
或 16 位 内 存单 元 的 地 址 。 而 且 ， 很 有 意思 的 是 ， 目 的 操作 数 和 源 操作 数 
的 大 小 是 不 同 的 。 这 里 有 几 个 例子 : 


IOVZX CX al 
movzx eax,byte [Ox2000] 


Mov2 EC bz 


对 于 上 上面 的 第 一 个 例子 ， 如 果 指 令 执 行列 ，AL 寄存 右 的 内 容 是 
0xC0， 那 么 ， 指 令 执行 后 ，CX 寄存 撕 的 内 容 为 0x00C0; 对 于 第 二 个 例 
子 ， 处 理 占 访问 段 守 和 存 右 DS 所 指 回 的 段 ， 从 仿 移 地 址 0x2000 处 取得 一 
字 节 ， 左 边 添加 24 个 “0”"， 使 之 扩展 到 32 位 ， 然 后 传送 到 EAX 寄存 需 ; 
对 于 第 三 个 例子 ， 如 果 指 令 执行 前 ，BX 寄存 器 的 内 容 为 0x55AA， 那 
么 ， 指 令 执行 后 ，ECX 寄存 需 的 内 容 为 0xX000055AA。 

另 一 个 非常 有 用 的 指令 是 movsx， 意 思 是 带 符号 扩展 的 传送 (Move 
with Sign-Extension〉， 指 令 格 式 为 


movsx rl16,r/m8 
moOovex 32, /me 


movesx rT32 /mis 


和 movzx 不 同 ，movsx 在 执行 扩展 时 ， 用 于 扩展 的 比特 取 目 源 操 作 
数 的 符号 位 。 比 如 


mov al,0O0x08 


movex cx,al ;CX=0x0008， 因 为 AL 的 最 高 位 是 “0” 


mov al 0x5 


mMOVvSX ECX,al ;ECX=0xFFFFFFF5， 因 为 AL 的 最 高 位 是 “1” 


GDT 的 界限 是 16 位 的 ， 人 允许 64KB 的 大 小 ， 即 8192 个 描述 符 ， 似 
乎 不 需要 使 用 32 位 的 寄存 器 EBX。 事 实 上 ， 还 是 需要 的 ， 因 为 后 面 要 用 
它 来 计算 新 描述 符 的 32 位 线性 地 址 ， 加 法 指令 add 要 求 的 是 两 个 32 位 操 
作 数 。 

第 282 行 ， 将 GDT 的 界限 值 加 1， 就 是 GDT 的 总 字 节 数 ， 也 是 新 擂 
述 符 在 GDT 内 的 偏 移 量 。 不 过 ， 很 奇怪 的 是 ， 我 们 用 的 是 指令 


ne x 


noe er 


这 是 为 什么 呢 ? 

这 是 有 道理 的 。 就 一 般 的 情况 来 说 ， 在 这 里 用 这 两 条 指令 的 哪 一 
条 ， 都 没有 问题 。 但 是 ， 如 果 这 是 局 动 计 算 机 以 来 ， 第 一 次 在 GDT 中 安 
装 摘 述 从 ， 可 能 束 会 产生 问题 。 在 初始 状态 下 ， 也 就是 计算 机 局 动 之 
后 ， 这 时 还 没有 使 用 GDT，GDTR 寄存 器 中 的 基地 址 为 0x00000000， 界 
限 为 OxFFFF。 


当 GDTR 寄存 器 的 界限 部 分 是 0xFFFF 时 ， 表 明 GDT 中 还 没有 描述 
符 。 因 此 ， 将 此 值 加 1， 结 果 是 0x10000， 由 于 该 寄存 器 的 界限 部 分 只 有 
16 位 ， 所 以 只 能 容纳 16 位 的 结果 ， 即 0x0000， 这 就 是 第 一 个 描述 符 在 
表 内 的 偏 移 量 。 

同样 的 道理 ， 因 为 EBX 寄存 右 中 有 的 内 容 是 GDT 的 界限 值 
0x0000FFFF， 如 果 执 行 的 是 指令 


Tnce Gx 


那么 ，EBX 寄存 器 中 的 内 容 将 是 0x00010000， 以 它 作 为 第 一 个 描述 

符 的 偏 移 量 显然 是 不 对 的 。 相 反 ， 如 果 执 行 的 是 指令 是 
yeve. WN oP 

那么 ， 因 为 BX 寄存 器 只 有 16 位 ， 故 ， 结 果 为 0x0000， 进 位 被 丢弃 
( 决 不 会 影响 EBX 寄存 器 的 高 16 位 ) 。 此 指令 执行 后 ，EBX 寄存 器 的 
内 容 是 0x00000000。 

第 283 行 ， 用 计算 出 来 的 偏 移 量 加 上 GDT 的 基地 址 ， 结 果 就 是 新 描 
述 符 的 线性 地 址 。 事 实 上 ， 这 三 行 或 许可 以 按 以 下 方法 来 简单 处 理 ， 束 
没 那 么 史 唆 了: 


XOr ebx,ebx 


mov bx Loogat| ;GDT 者 限 
L1G ,DA ;GDT 总 字 节 数 ， 也 是 下 一 个 描述 符 偏 移 
add ebx, [pgdt+2] ;下 一 个 摘 述 符 的 线性 地 址 


但 是 ， 少 用 一 条 指令 似乎 更 好 ， 谁 知道 呢 ! 

既然 已 经 知道 新 摘 述 符 应 该 安装 在 哪里 ， 第 285、286 行 ， 访 问 段 寄 
存 器 ES 所 指向 的 4GB 内 存 段 ， 将 EDX:EAX 中 的 64 位 描述 符 写 入 由 EDI 
寄存 器 所 指 癌 的 偏 移 处 。 


第 288 一 290 行 ， 访 问 内 核 数据 段 ， 将 GDT 的 界限 值 加 上 8， 然 后 用 
lgdt 指令 重新 加 载 GDTR， 使 新 的 描述 符 生 效 。GDTR 寄存 器 中 的 界限 值 
总 是 单数 〈8 的 整数 倍 减 1) ， 包 括 它 的 初始 值 0xXFFFF。 所 以 ， 每 次 只 
要 加 上 新 描述 符 的 实际 大 小 就 能 得 到 正确 的 界限 值 。 


最 后 ， 第 292 一 297 行 ， 根 据 GDT 的 新 界限 值 ， 来 生成 相应 的 段 选 
择 子 。 具 体 的 算法 是 ， 取 得 GDT 的 当前 界限 值 ， 除 以 8， 人 余数 丢 寞 。 描 
述 符 的 索引 是 从 0 开始 编号 的 ， 界 限 值 总 是 比 GDT 的 总 字 节 数 小 1。 
此 ， 界 限 值 除 以 ， 一 定 会 有 余数 〈 余 7， 和 于 弃 不 用 ) ， 商 就 是 我 们 所 要 
得 到 的 描述 符 索 引号。 最 后 ， 将 索引 号 左 移 3 次 ， 留 出 TI 位 和 RPL 位 
(Tl 二 0， 指 向 GDT，RPL 二 00) ， 这 就 是 要 生成 的 选择 子 。 


第 299 一 306 行 ， 恢 复 调 用 之 前 的 现场 ， 返 回调 用 者 。 返 回 时 用 了 
retf 指令 ， 因 此 ， 本 过 程 只 能 通过 远 过 程 调用 的 方式 进入 。 


继续 回 到 过 程 load relocate program。 


安 猴 了 了 用户 程序 尖 部 段 的 毛 述 从 后 ， 第 440 行 ， 将 充 段 的 选择 子 与 
回 到 用 户 程 序 尖 部 ， 供 用 户 程 序 在 接 害 处 理 带 控制 权 之 后 使 用 。 实 际 
上 ， 在 内 核 同 用 尸 程 序 转 交 控 制 权 时 ， 也 要 用 到 。 


第 443 一 460 行 ， 用 于 重 定 位 用 户 程 序 代 人 码 段 和 数据 段 ， 并 创建 和 安 
装 相 应 的 摘 述 符 ， 整 个 过 程 都 是 一 样 的 ， 也 很 容易 理解 。 

唯一 不 同 的 是 栈 段 ， 栈 所 用 的 空间 不 需要 用 户 程序 提供 ， 而 是 由 内 
核 动态 分 配 。 内 核 分 配 栈 空间 时 ， 是 以 4KB 为 单位 的 ， 也 束 是 说 ， 每 次 
分 配 至 少 是 4KB 的 倍数 。 人 至 于 到 辰 分 配 多 少 ， 用 户 程序 应 该 根据 目 己 的 
实际 需求 提出 建议 。 

第 463 行 ， 从 用 户 程序 头 部 偶 移 为 0x0C 的 地 方 获得 一 个 建议 的 栈 大 
小 。 这 是 一 个 倍率 ， 至 少 应 当 为 1， 说 明 用 户 程序 希望 分 配 4KB 栈 。 如 果 
为 2， 说 明 硕 望 分 配 8KB; 为 3 则 表明 希望 分 配 12KB， 依 此 类 推 。 

第 464、465 行 ， 计 算 栈 段 的 界限 。 如 果 栈 段 的 粒度 是 4KB， 那 么 ， 
用 0xFFFFF 减 去 倍率 ， 就 是 用 来 创建 描述 符 的 段 界 了 眼 。 举 例 来 说 ， 如 果 
用 户 程序 建议 的 倍率 是 2， 那 么 ， 这 意味 着 他 想 创建 的 栈 空间 为 8KB。 
此 ， 段 的 界限 值 为 


OxPEFEE 之 二 和 RERED 
那么 ， 当 处 理 如 访问 该 栈 段 时 ， 实 际 使 用 的 段 界 限 为 
OxFFFFDX Ox1000+OxFFF=0xFFFFDFFF 


栈 是 同 下 扩展 的 ， 访 问 32 位 的 栈 ， 要 使 用 栈 指针 寄存 器 ESP， 其 最 
大 值 是 0xFFFFFFFF 。 此 ，ESP 的 值 只 允许 在 0xFFFFDFFF 和 
0xFFFFFFFF 之 间 变 化 ， 共 8KB。 


第 466 一 469 行 ， 用 4096 (4KB) 乘 以 倍率 ， 得 到 所 需要 的 栈 大 小 ， 
然后 ， 用 这 个 值 去 申请 内 存 。 这 是 一 个 32 位 的 无 符号 数 滋 法 ， 指 令 格 式 
为 


mul EAm22 


这 里 ， 用 EAX 寄存 右 的 值 ， 乘 以 男 一 个 32 位 的 数 〈 可 以 在 通用 寄存 
器 或 者 内 存单 元 里 ) ， 在 EDX:EAX 中 得 到 64 位 的 乘法 结果 。 


注 量 ，allocate_ memory 过 程 返回 所 分 配 内 存 的 低 端 地 址 。 和 一 般 
的 数据 段 不 同 ， 栈 描述 符 中 的 基地 址 ， 应 当 是 栈 空间 的 高 端 地 址 。 所 
以 ， 第 470 行 ， 用 allocate_memory 返回 的 低 端 地 址 ， 加 上 栈 的 大 小 ， 得 
到 栈 空 间 的 高 端 地 址 。 

第 471 一 473 行 ， 依 次 调用 两 个 例 程 ， 来 生成 和 安装 栈 段 的 描述 符 。 
注意 栈 的 属性 值 ， 它 指明 了 这 是 一 个 32 位 的 栈 段 ， 粒 上 度 为 4KB。 

第 474 行 ， 将 栈 段 的 选择 子 写 回 到 用 户 程序 头 部 ， 供 用 户 程序 在 接 
管 处理 需 控制 权 之 后 使 用 。 


13.4.5 重 定 位 用 户 程序 内 的 符号 地 址 


为 了 使 用 内 核 捉 供 的 例 程 ， 用 户 程序 需要 建立 一 个 符号 -地 址 对 照 表 
(SALT) 。 这 样 ， 当 用 户 程 序 加 载 后 ， 凡 核 应 该 根据 这 些 符 亏 名 来 回 需 
它们 对 应 的 入 口 地 址 ， 这 称 为 符号 地 址 的 重 定位 。 显 然 ， 重 定位 的 过 程 
驶 征 字 人 符 串 匹配 和 比较 的 过 程 。 

为 了 对 用 户 程序 内 的 符 亏 名 进行 匹配 ， 内 核 也 必须 建立 一 张 符 号 -地 
址 对 照 表 (SALT) 。 


内 核 的 SALT 表 位 于 代码 清单 13-2 的 内 核 数 据 段 中 ， 从 第 338 行 开 
始 ， 一 直到 此 357 行 结束 。 实 际 上 ， 这 个 表 是 可 以 根据 需要 扩展 的 。 


如 图 13-9 所 示 ， 用 户 程序 内 的 SALT 表 ， 每 个 条 目 是 256 字 节 ， 用 
于 容纳 符号 名 ， 不 足 256 字 节 的 ， 用 零 填 充 。 内 核 中 的 SALT 表 ， 每 个 条 
目 则 包括 两 部 分 ， 第 一 部 分 也 是 256 字 节 的 符号 名 ; 第 二 部 分 有 6 字 节 ， 
用 于 容纳 4 字 节 的 偏 移 地 址 和 2 字 节 的 段 选择 子 ， 因 为 符号 名 是 用 来 描述 
例 程 的 ， 这 6 字 节 束 是 例 程 的 入 口 地 址 。 


6 学 节 的 例 程 入 口 
地 址 


(PrintString 


(QPrintString 
(QReadDiskData 


(QDReadDiskData 
(TerminateProgram 





(TerminateProgram ee 
(WPrintDwordAsHexString | 





图 13-9 内核 和 用 户 程 序 内 的 符号 表 结 构 


举 个 内 核 中 的 例子 : 


Salt lo eekEeng， 
tMmes 256— (5—Salt 1) db 0 
dd ut string 
cwNSsys OULINe Seg 381 


这 是 内 核 SALT 表 的 第 一 个 条 目 。 它 初始 化 了 一 个 256 字 节 的 符号 


名 ， 该 名 称 的 前 12 个 字符 是 “@PrintString”， 因 为 不 足 256 字 节 ， 后 面 填 


充 244 个 0x00。 

在 该 条 目的 后 面 ， 先 是 一 个 双 字 ， 人 初始 化 为 put_string 例 程 的 偏 移 地 
址 。 这 束 是 说 ，PrintString 其 实 就 是 put string 的 别名 ， 调 用 
PrintString， 其 实 是 调用 put_string 例 程 。 在 用 户 程序 内 ， 只 能 通过 远 过 
程 调 用 来 进入 该 例 程 ， 所 以 ， 该 条 目的 最 后 是 一 个 字 ， 用 公共 例 程 段 的 
选择 子 来 初始 化 ， 因 为 put_string 例 程 位 于 公共 例 程 段 。 


在 内 核 SALT 表 中 ， 比 较 有 意思 的 是 最 后 一 个 条 目 : 


salt 4 db ‘Q&TerminateProdgram’ 
times 256—(9—salt 4) ‘db 0 


dd return Domne 


CW CoOre COUS SCY Sel 


在 这 里 ， 从 名 字 可 以 看 出 ,，“TerminateProgram”" 的 意思 是 终止 程 
序 。 当 用 户 程序 调用 该 过 程 时 ， 意 味 痢 结束 用 户 程序 ， 将 控制 返回 到 内 
核 。 

当 用 户 程 序 终止 并 返回 时 ， 返 回 点 位 于 标号 return_point 所 在 的 位 
置 。 该 标号 位 于 第 582 行 ， 属 于 内 核 代 人 码 段 。 在 这 一 行 之 前 ， 是 内 核 将 
控制 权 交 给 用 户 程 序 的 指令 。 

内 核 的 SALT 表 是 静态 的 ， 适 用 于 所 有 要 加 载 的 用 户 程序 ， 理 所 当然 
地 要 比 用 户 程序 的 SALT 表 大 ， 因 为 它 要 提供 所 有 可 被 用 户 程 序 调用 的 过 
程 列 表 。 全 于 用 户 程 序 ， 根 据 需 要 ， 它 只 会 列 出 自己 用 到 的 那些 。 


在 用 户 程 序 加 载 时 ， 内 核 的 任务 是 比 对 这 两 张 SALT 表 ， 并 将 用 户 程 
序 SALT 表 中 的 符号 名 车 换 成 相应 的 入 口 地 址 。 为 了 便于 说 明 ， 用 户 程序 
的 SALT 表 简 称 U-SALT， 内 核 的 SALT 表 人 简称 C-SALT。 


基本 的 算法 是 使 用 内 外 层 循环 ， 外 循环 依次 从 U-SALT 表 中 取出 条 
目 ， 每 取出 一 个 条 目 ， 就 进入 内 循环 进行 比 对 ; 内 循环 遍历 C-SALT 中 的 
每 一 个 条 目 ， 同 外 循环 输入 的 条 目 进行 比 对 。 
比 对 的 过 程 就 是 两 个 字符 串 的 比较 过 程 ， 可 以 使 用 cmps 指令 
(Compare String Operands) 。 访 指令 有 3 种 基本 的 形式 ， 分 别 用 于 字 
节 、 字 和 双 字 的 比较 : 


cmpsb ; 字 节 比较 
cmpsw ; 字 比 较 
cmpsd ; 双 字 比较 


在 16 位 模式 中 ， 源 字符 串 的 首 地 址 由 DS:SI 指定 ， 目 的 字符 串 的 首 
地 址 由 ES:DI 指定 ; 在 32 位 模式 下 ， 则 分 别 是 DS:ESI 和 ES:EDI。 在 处 理 
右 内 部 ，cmps 指令 有 的 操作 是 把 两 个 操作 数 相 减 ， 然 后 根据 结果 设置 标志 
寄存 右 中 相应 的 标志 位 。 


取决 于 标志 寄存 器 EFLAGS 中 的 DF 位 ， 如 果 DF 二 0， 表 明 是 正 向 比 
较 ， 也 束 是 按 地 址 递增 的 方 同 比较 ， 这 些 指 令 执 行 后 ，SI (ESI)〉 和 
DI (EDI) 的 内 容 分 别 加 1、 加 2 和 加 4; 否则 ， 如 果 DF = 二 1， 表 明 是 反问 
比较 ， 这 些 指令 执行 后 ，SI (ESI)〉 和 DI (EDI) 的 内 容 分 别 减 1、 减 2 和 
减 4。 


单纯 的 cmps 指令 只 比较 一 次 ， 它 属于 推 一 下 才 动 一 动 的 那 种 类 型 。 
所 以 ， 需 要 加 指令 前 缀 rep 使 比较 连续 进行 。 连 续 比 较 的 次 数 由 
CX (ECX) 宫 存 右 控 制 ， 在 16 位 模式 下 ， 使 用 CX 寄存 器 ; 在 32 位 模 
式 下 ， 使 用 ECX 寄存 器 ， 举 个 例子 : 


leitS 32| 


rep cmpsd 


该 指令 执行 时 ， 每 次 比较 4 字 市 ， 连 续 比 较 直 至 ECX 寄存 需 的 内 容 

问题 是 ， 用 rep 前 绥 比 不 出 个 所 以 然 来 ， 你 就 是 重复 比较 100000 
次 ， 也 看 不 出 两 个 字符 串 哪 里 不 同 。 所 以 ， 针 对 cmps 指令 ， 应 当 使 用 
repe (repz) 和 repne (repnz) 前 缀 ， 前 者 的 意思 是 "在 相 等 〈 为 入) 则 
重复 "， 后 者 的 意思 是 “ 知 不 等 〈 非 零 ) 则 重复 "。 但 无 论 是 哪 种 情况 ， 总 
的 比较 次 数 由 CX《〈ECX) 控制 ， 表 13-1 显示 了 这 几 种 控制 手段 的 区 别 。 


全 


表 13-1 重复 前 绥 


可 见 ，repe/repz 用 于 搜索 第 一 个 不 匹配 的 字 节 、 字 或 者 双 字 ， 
repne/repnz 用 于 搜索 第 一 个 匹配 的 字 节 、 字 或 者 双 字 。 无 论 如 何 ， 匹 配 
和 不 匹配 的 位 置 分 别 由 (E)SIl 和 (E)DI 寄存 器 指示 。 

言 归 正 传 ， 我 们 继续 回 到 代码 清单 13-2 中 来 。 

如 图 13-10 所 示 ， 为 了 重 定 位 U-SALT， 我 们 打算 用 DS:ESI 指向 C- 
SALT， 用 ES:EDI 指向 USALT。 第 477、478 行 ， 访问 4GB 内 存 段 ， 从 
用 户 程 序 尖 部 偏 移 为 0x04 的 地 方 取出 刚刚 安装 好 的 头 部 段 选 择 子 ， 并 使 
段 寄 存 亏 ES 指 癌 用 户 程序 头 部 段 ， 因 为 U-SALT 位 于 用 户 程序 头 部 段 
内 。 





第 479、480 行 ， 使 段 寄 存 器 DS 指 回 内 核 数 据 段 。 因 为 C-SALT 位 
于 内 核 数 据 段 中 。 

第 482 行 ， 清 标志 寄存 器 EFLAGS 中 的 方向 标志 ， 使 cmps 指令 按 正 
问 进 行 比较 。 


实施 比较 的 算法 我 们 已 经 介绍 过 了 。 外 循环 的 作用 是 依次 从 U-SALT 
中 取出 各 个 条 目 ， 因 此 ， 第 484 行 ， 将 取 的 次 数 〈 条 目的 个 数 ) 从 用 户 
程序 头 部 取出 ， 传 送 到 ECX 寄存 器 。 


内 核 程 序 一 ee 
C-SALT = 逐个 比较 A 
ee | 用 户 程 序 
| U-SALT 
DS:ESI 一 > ES:EDI 


图 13-10”U-SALT 和 C-SALT 的 比 对 过 程 示 意图 
接着 ， 第 485 行 ， 用 于 将 U-SALT 在 头 部 段 内 的 偏 移 量 传送 到 EDI 寄 
存 右 。 了 刚才 我 们 已 经 使 段 寄 存 需 ES 指 癌 了 头 部 段 。 


外 循环 的 结构 如 下 所 示 ， 这 和 古 从 代码 清单 中 抽出 来 的 ， 行 亏 也 保持 
不 变 。 


486 "D2: 
48 7 push ecx 
488 push edi 
489 
; 此 处 放置 内 循环 代码 ， 用 于 实际 进行 比较 。 
512 pop edi 
S13 add ed1i,2356 
514 pop ecx 
S15 Lo0B RE2 


由 于 内 循环 也 要 使 用 ECX 和 EDI 寄存 器 ， 并 有 可 能 破坏 它们 的 内 
容 ， 因 此 ， 在 进入 内 循环 之 前 ， 要 对 它们 压 栈 保护 ， 以 便 退 出 内 循环 后 
继续 使 用 。 外 循环 的 任务 是 从 U-SALT 中 依次 取出 表 项 ， 因 此 ， 当 内 循环 
完成 比 对 后 ， 第 512、513 行 ， 从 栈 中 弹出 EDI 寄存 需 的 原始 内 容 ， 并 加 
上 256， 以 指向 下 一 个 条 目 。 第 514、515 行 ， 从 栈 中 弹出 ECX 寄存 器 的 
原 值 。loop 指令 将 ECX 的 内 容 减 一 ， 根 据 结果 判断 是 否 继续 循环 。 


对 于 外 循环 所 指 问 的 每 一 个 条 目 ， 内 循环 要 用 它 和 C-SALT 中 的 所 有 
条 目 进行 比 对 ， 内 循环 的 代码 如 下 : 


490 miecx 3alt items 
491 mov esi,salt 

492 D3. 

493 push edi 

494 push esil 

495 push ecx 


;这 里 放置 实际 进行 比 对 的 代码 


DUO6 POP ecx 

S507 pop esi 

508 add esi,salt item len 
509 pop edi 

和 JOoD. -B33 


每 次 从 外 循环 进入 内 循环 时 ， 都 要 重新 设置 比 对 次 数 ， 并 重新 使 ESI 
寄存 器 指 癌 C-SALT 的 开始 处 ， 这 是 第 490、491 行 的 工作 。 标 号 
salt_item_len 是 在 第 359 行 声明 的 ， 并 用 一 个 表达 式 初 始 化 。 每 个 条 目 
的 长 度 都 是 相同 的 ， 用 当前 汇编 地 址 减 去 标号 salt_4 的 汇编 地 址 ， 即 $- 
salt 4， 束 是 每 个 条 目的 长 度 〈 字 市 数 ) 。 事 实 上 ， 这 个 数值 是 在 编译 阶 
段 由 编译 器 计算 的 ， 在 数值 上 等 于 262。 


标号 salt_items 是 在 第 360 行 声 明 的 ， 并 初始 化 为 一 个 表达 式 。 该 表 
达 式 的 意思 是 ， 用 整个 CSALT 的 长 度 ， 除 以 每 个 条 目的 长 度 ， 就 是 条 目 
的 个 数 。 


对 于 内 循环 的 每 一 次 执行 ， 都 要 把 ESI、EDI 和 ECX 压 栈 保护 ， 以 
免 在 比 对 的 过 程 中 用 到 并 破坏 这 些 寄存 器 。 每 次 比 对 结束 后 ， 第 506 一 
509 行 ， 依 次 弹出 这 些 寄存 喜 的 值 ， 并 把 ESI 的 内 容 加 上 C-SALT 每 个 条 
目的 长 度 (262 字 节 ) ， 以 指 癌 下 一 个 C-SALT 条 目 。 第 510 行 ，loop 指 
令 执 行 时 ， 将 ECX 的 内 容 减 一 并 判断 是 否 继 续 循 环 。 

第 497 一 503 行 ， 是 整个 比 对 过 程 的 核心 部 分 。 每 当 处 理 咒 执行 到 这 
里 时 ，DS:ESI 和 ES:EDI 都 各 自 指 回 C-SALT 和 U-SALT 中 的 某 个 条 目 : 


497 movVv ecx,64 


498 repe cmpsd 

499 Jnz .b4 

500 mov eax, [esi] 

S01 mov [es:edi-256],eax 
5O02 mov ax, [esi+4] 

503 mov [es:edi-252],ax 
504 D4: 


因为 每 个 条 目的 符号 名 部 分 是 256 字 节 ， 每 次 用 cmpsd 指令 比较 4 
字 节 ， 故 每 个 条 目 至 多 需要 比 对 64 次 。 第 497 行 把 立即 数 64 传送 到 ECX 
寄存 器 以 控制 整个 比 对 过 程 。 


第 498 行 ， 开 始 比 对 ， 和 直到 友 现 一 个 不 相符 的 地 方 。 


如 果 两 个 字符 串 相 同 ， 则 需要 连续 比 对 64 次 ， 而 且 ， 在 比 对 结束 
时 ，ZF 三 1， 表 示 最 后 4 字 节 也 相同 ， 如 果 两 个 字符 串 不 同 ， 比 对 过 程 会 
提前 结束 ， 且 ZF 二 0。 在 最 坏 的 情况 下 ， 这 两 个 字符 串 可 能 只 有 最 后 4 字 
节 是 不 同 的 。 在 这 种 情况 下 ， 也 需要 比 对 64 次 ， 但 ZF 二 0。 


无 论 哪 种 情况 ， 如 果 在 退出 repe cmpsd 指令 时 ZF 二 0， 即 表明 两 个 
字符 串 是 不 同 的 。 所 以 ， 第 499 行 ， 如 果 ZF 二 0， 则 表明 两 个 字符 串 不 
同 ， 直 接 转移 到 内 循环 的 来 尾 ， 以 开始 下 一 次 内 循环 。 

如 果 两 个 字符 串 是 相同 的 ， 那 么 ， 比 较 指 令 执行 后 ，ESI 寄存 器 正 
好 指 问 C-SALT 每 个 条 目 后 的 入 口 数 据 。 要 知道 ，C-SALT 中 的 每 个 条 日 
是 262 字 节 ， 最 后 的 6 字 节 分 别 是 偏 移 地 址 和 上 段 选 择 子 。 

因此 ， 现 在 的 任务 是 将 这 结尾 的 6 字 节 传送 到 U-SALT 当前 条 目的 开 
始 部 分 ， 这 是 第 500 一 503 行 的 工作 。 最 后 的 结果 是 ，U-SALT 中 的 当前 
条 日 ， 其 开始 的 6 字 节 被 改写 为 一 个 入 口 地 址 。 


13.5 执行 用 户 程 序 


在 load _relocate_program 过 程 的 最 后 ， 第 517 行 ， 把 用 户 程序 头 部 
段 的 选择 子 传送 到 AX 寄存 器 。 第 519 一 528 行 ， 从 栈 中 弹出 并 恢复 各 个 
寄存 右 的 原始 内 容 ， 并 返回 到 调用 者 。AX 寄存 器 中 的 选择 子 是 作为 参数 
返回 到 主 程序 的 。 主 程序 将 用 它 来 找到 用 户 程 序 的 入 口 ， 并 从 那里 进 

从 load_relocate_program 过 程 返 回 后 ， 第 572、573 行 用 于 在 屏 共 
上 显示 信息 ， 表 示 加 载 和 重 定位 工作 已 经 完成 。 

第 575 行 ， 保 存 内 核 的 栈 指针 。 这 是 通过 将 ESP 寄存 右 的 当前 值 写 
入 内 核 数据 段 中 来 完成 的 。 写 入 的 位 置 是 由 标号 esp_pointer 指示 的 ， 位 
于 第 378 行 ， 初 始 化 为 一 个 双 字 。 在 进入 用 户 程 序 后 ， 用 户 程序 应 当 切 
换 到 它 上 自己 的 栈 。 从 用 户 程序 返回 时 ， 还 要 从 这 个 内 存 位 置 还 原 内 核 栈 
指针 。 

第 577 行 ， 使 段 寄存 右 DS 指 同 用 户 程 序 头 部 。 这 是 通过 将 用 尸 程 序 
头 部 段 选 择 子 传送 到 DS 来 办 到 的 。 在 用 户 程 序 头 部 段 内 偏 移 0x10 处 ， 
征用 户 程 序 的 入 口 点 ， 分 别 是 32 位 的 偶 移 量 和 16 位 的 代码 段 选择 子 。 第 
579 行 ， 执 行 一 个 间接 远 转移 ， 进 入 用 户 程 序 内 接着 执行 。 


现在 转 到 代码 清单 13-3。 

用 户 程 序 的 入 口 点 是 在 第 56 行 。 进 入 用 户 程序 开始 执行 时 ， 段 寄存 
侣 DS 是 指 同 头 部 段 的 。 第 57、58 行 ， 使 段 寄 存 需 FS 指 回 头 部 段 ， 因 为 
后 面 要 调用 内 核 过 程 ， 而 这 些 过 程 都 要 求 使 用 DS， 所 以 要 把 DS 解放 出 
> 

第 60 一 62 行 ， 切 换 到 用 户 程 序 自 己 的 栈 ， 并 初始 化 栈 指针 寄存 器 
ESP 的 内 容 为 0。 

第 64、65 行 ， 设 置 段 寄存 器 DS 到 用 户 程序 自己 的 数据 段 。 

第 67、68 行 ， 调 用 内 核 过 程 显示 字符 串 ， 以 表明 用 户 程序 正在 运行 
中 。 该 内 核 过 程 要 求 用 DS:EBX 指向 零 终 止 的 字符 串 。 


第 70 一 72 行 ， 调 用 内 核 过 程 ， 从 硬盘 读 一 个 鹿 区。 从 内 核 代 码 清单 
可 以 知道 ，ReadDiskData 过 程 的 内 部 名 称 是 read_hard disk _ 0。 上 所 以 ， 


ReadDiskData 需要 传 入 两 个 参数 ， 第 一 个 是 EAX 寄存 右 ， 传 入 要 读 的 
逻辑 而 区 亏 ; 第 二 个 是 DS:EBX， 传 入 缓冲 区 的 首 地 址 ， 毕 竟 读 出 来 的 数 
据 要 有 个 地 方 保 存 。 绥 神 区 位 于 用 户 程序 的 数据 段 中 ， 古 在 第 43 行 用 标 
号 buffer 声明 的 ， 并 初始 化 了 1024 字 节 的 空间 。 要 读 的 逻辑 扇 区 号 是 
100， 在 此 之 前 ， 我 们 应 当 在 这 个 而 区 里 写 一 些 东 西 。 这 件 事 我 们 马上 融 
要 讲 到 。 

第 74 一 78 行 ， 先 调用 内 核 过 程 显 示 一 个 题 头 ， 接 着 ， 再 次 调用 内 核 
过 程 显示 刚刚 从 硬盘 读 出 的 内 容 。 

在 做 完了 上 上述 事情 之 后 ， 用 户 程序 的 任务 也 天 完成 了 。 第 80 行 ， 调 
用 内 核 过 程 ， 以 返回 到 内 核 。 

再 次 回 到 代码 清单 13-2。 

在 内 核 中 ， 有 用户 程序 的 返回 点 位 于 第 582 行 。 


在 重新 接管 了 处 理 器 的 控制 权 后 ， 第 583、584 行 ， 使 段 寄存 器 DS 
重新 指 癌 内 核 数 据 段 。 


第 586 一 588 行 ， 切 换 栈 ， 使 栈 段 寄存 占 SS 重新 指 癌 内 核 栈 段 ， 并 
从 内 核 数据 段 中 取得 和 恢复 原先 的 栈 指针 位 置 。 


第 590、591 行 ， 显 示 一 条 消息 ， 表 示 现 在 已 经 回 到 了 内 核 。 


对 于 一 个 操作 系统 来 说， 下面 的 任务 是 回收 前 一 个 用 户 程序 所 局 用 
的 内 存 ， 并 局 动 下 一 个 用 户 程序 。 但 是 ， 我 们 现在 无 事 可 人 做， 所以， 第 
596 行 ， 使 处 理 右 进入 停机 状态 。 列 筷 了 ， 在 进入 保护 模式 之 前 ， 我 们 
已 经 用 cli 指令 关 财 了 中 新， 所以， 除非 有 NMI 产生 ， 处 理 右 将 一 了 二 处 于 
停机 状态 。 





13.6 ”代码 的 编译 、 运 行 和 调试 


首先 编译 本 章 所 有 的 源 和 程序 文件 ， 它 们 是 c13_mbr.asm 、 
c13_core.asm 和 c13.asm， 这 将 分 别 生 成 c13_mbr.bin、c13_core.bin 以 
及 c13.bin。 


使 用 配 书 工具 FixVhdWr 分 别 将 这 些 二 进 制 文件 写 入 虚拟 人 硬盘 。 
c13_mbr.bin 的 起 始 馆 辑 夯 区 亏 是 0， 因 为 它 是 主 引 导 人 代码 : 
c13_core.bin 的 起 始 逻 辑 扇 区 号 是 1; c13.bin 的 起 始 逻 辑 扇 区 号 是 50。 
除了 c13 mbrbin 外 ， 其 他 文件 的 写 入 位 置 可 以 改变 ， 但 前 提 是 要 修改 使 
用 它们 的 源 代码 。 


用 户 程 序 的 功能 是 读 取 逻辑 扇 区 100， 并 显示 其 内 容 。 为 此 ， 需 要 找 
一 个 文本 文件 ， 并 将 它 写 入 该 扇 区 。 在 配 书 源 代 码 中 ， 提 供 了 一 个 文本 
文件 diskdata.txt， 其 大 小 是 512 字 节 。 如 图 13-11 所 示 ， 它 包含 了 512 字 
节 的 丙 文 文本 。 

不 强迫 你 一 定 要 使 用 这 个 文件 。 你 完全 可 以 选用 其 他 文件 ， 文 件 的 
内 容 也 无 所 谓 ， 但 最 好 是 可 谈 的 ASCII 字符 。 

使 用 配 书 工具 FixVhdWr 将 你 采用 的 文本 文件 写 入 虚拟 人 硬盘， 逻辑 剧 
区 号 是 100。 如 果 你 采用 的 是 其 他 文件 ， 它 或 许 很 长 ， 会 连续 写 入 多 个 属 
区 。 这 无 所 请， 用 户 程 序 只 读 取 第 一 个 。 

最 后 ， 启 动 虚拟 机 时 ， 如 果 一 切 正常 ， 所 显示 的 画面 将 如 图 13-12 所 
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图 13-11 diskdata.txt 文件 的 内 容 
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图 13-12 ”本 章程 序 的 运行 结果 


具有 讽刺 意味 的 是 ， 我 在 这 里 大 书 特 书 、 侃 侃 而 谈 INTEL 的 处 理 
费 ， 但 是 ， 从 截图 上 可 以 看 出 ， 我 用 的 处 理 器 却 是 AMD 生产 的 。 人 至 于 你 
的 计算 机 用 了 什么 处 理 器 ， 你 自己 看 看 吧 ， 屏 幕 上 的 显示 会 说 明 一 切 
的 。 

随 寿 程序 代码 量 的 增 大 ， 程 序 的 编写 和 调试 也 会 变 得 越 来 越 困 难 。 
特别 是 当 问 题 发 生 的 时 候 ， 氨 查 出 错 的 位 置 和 错误 的 原因 都 需要 花费 大 
量 的 时 间 、 消 耗 大 量 的 精力 。 

有 时候， 最 简单 的 方法 却 很 有 效 。 比 如 ， 可 以 写 一 个 特殊 的 过 程 ， 
用 来 显示 某 个 寄存 器 的 内 容 。 如 果 你 的 程序 运行 时 出 了 问题 ， 可 以 在 有 
重大 嫌疑 的 指令 前 后 安排 一 些 调 用 该 过 程 的 代码 ， 看 看 是 哪里 不 正常 。 
这 些 用 于 调试 程序 的 位 置 ， 叫 做 检查 点 。 

为 了 方便 调试 程序 ， 代码 清 单 13-2 提供 了 一 个 过 程 
put_hex_dword， 用 于 以 十 六 进 制 的 形式 显示 EDX 宫 存 右 的 内 容 。 

该 过 程 位 于 第 202 行 ， 它 的 工作 原理 很 简单 ，EDX 寄存 器 是 32 位 
的 ， 从 右 到 左 ， 将 它 以 4 位 为 一 组 ， 分 成 8 组 。 每 一 组 的 值 都 在 0 一 
15 《0x0 一 0xf) 之 间 ， 我 们 把 它 转换 成 相应 的 字符 '0' 一 'F’ 即 可 。 

为 了 将 数值 转换 成 可 显示 的 ASCII 码 ， 可 以 使 用 处 理 器 的 查 表 指令 
xlat (Table Look-up Translation ) ， 该 指令 要 求 事先 在 DS:(E)BX 处 定义 
一 个 用 于 转换 编码 的 表格 ， 在 16 位 模式 下 ， 使 用 BX 寄存 器 ; 在 32 位 模 
式 下 ， 使 用 EBX 寄存 器 。 指 令 执 行 时 ， 处 理 器 访问 该 表格 ， 用 AL 寄存 器 
的 内 容 作为 偏 移 量 ， 从 表格 中 取出 一 字 节 ， 传 回 AL 寄存 占 。 


代码 清单 13-2 定义 的 表格 在 第 374 行 。 在 那里 ， 声 明了 标号 

bin_hex， 并 初始 化 了 16 个 字符 ， 这 是 一 个 二 进 制 到 十 六 进 制 的 对 照 
(检索 ) 表 。 偏 移 〈 索 引 ) 为 0 的 位 置 是 字符 "0";， 偏 移 〈 索 引 ) 为 0x0f 
的 位 置 是 字符 “F”。 

第 209、210 行 ， 使 段 寄 存 器 DS 指向 内 核 数 据 段 ， 因 为 对 照 表 
bin_hex 位 于 内 核 数 据 段 中 。 

第 212 行 ， 使 EBX 寄存 占 指 问 检 索 〈( 对 照 表 ) 的 起 始 处 。 

转换 过 程 使 用 了 循环 ， 每 次 将 EDX 寄存 器 的 内 容 循环 左 移 4 位 ， 共 
需要 循环 8 次 。 每 次 移 位 后 的 内 容 被 传 达到 EAX 寄存 占 ， 并 用 and 指令 
保留 低 4 位 ， 高 位 清 零 。 第 218 行 ，xlat 指令 用 AL 寄存 器 中 的 值 作为 索 
引 访 问 对 照 表 ， 取 出 相应 的 字符 ， 并 回 传 到 AL 否 存 器 。 

每 次 从 检索 《对照 ) 表 中 得 到 一 个 字符 ， 束 要 调用 put_char 过 程 显 
示 它 。 但 put_char 过 程 需要 使 用 CL 寄存 器 作为 参数 。 因 此 ， 第 220 行 ， 
在 显示 之 前 先 要 将 ECX 寄存 器 压 栈 保护 。 

xlat 指 令 不 影响 任何 标志 位 。 


本 章 习 题 


在 本 章 中 ， 用 户 程 序 只 给 出 建议 的 栈 大 小 ， 但 并 不 提供 栈 空间 。 现 
在 ， 修 改 内 核 程 序 和 用 户 程 序 ， 改 由 用 户 程 序 目 行 皖 供 栈 空间 。 要 求 : 
栈 段 必 须 定 义 在 用 户 程序 头 部 之 后 。 


第 14 章 ”任务 和 特权 级 保护 


在 你 护 醒 式 下 ， 通 过 将 内 存 分 成 大 小 不 等 的 段 ， 并 用 朱 述 符 对 每 个 
段 的 有 用途、 类 型 和 长 度 进行 指定 ， 束 可 以 在 程序 运行 时 由 处 理 占 健 件 施 
加 访问 你 护 。 比 如 ， 当 程序 试图 让 处 理 右 去 写 一 个 可 执行 的 代码 段 时 ， 
处 理 冀 束 会 阻止 这 种 企图 ; 再 比如 ， 妆 程序 试图 让 处 理 右 访问 超过 段 界 
限 的 内 存 区 域 时 ， 处 理 器 也 会 引发 弄 常 中 靳 。 

段 你 护 是 处 理 带 皖 供 的 基本 保护 功能 ， 但 对 于 现实 的 需求 来 说 ， 仿 
尾 不 够 的 。 


自 完 ， 当 一 个 程序 老 老 实 实地 访问 只 属于 它 目 己 的 段 时 ， 基 本 的 段 
剑 护 机 制 是 很 有 效 的 。 但 是 ， 一 个 失控 的 程序 ， 或 者 一 个 恶意 的 程序 ， 
依然 可 以 通过 退 踪 和 修改 描述 符 衣 来 过 到 它们 访问 任何 内 存 位 置 的 目 
的 。 比 如 说 ， 如 果 用 户 程序 知道 GDT 的 位 置 ， 它 可 以 通过 向 段 寄存 器 加 
载 操 作 系 统 的 数据 段 搞 述 符 ， 或 者 在 GDT 中 增加 一 个 指 问 操作 系统 数据 
区 的 插 述 从 ， 来 修改 只 属于 操作 系统 的 私有 数据 。 对 于 处 理 右 那 种 和 3 尹 
小 孩 相 仿 的 重力 ， 所 有 这 一 切 都 是 合 读 的 。 


其 次 ，32 位 处 理 帮 是 为 多 任务 系统 而 设计 的 。 所 谓 多 任务 系统 ， 赴 
能 够 同时 执行 两 个 以 上 程序 的 系统 ， 即 使 前 一 个 程序 没有 执行 完 ， 其 
他 程序 也 可 以 开始 执行 。 在 单 处 理工 《和 核 ) 的 系统 中 ， 多 个 程序 并 不 可 
能 真 的 同时 执行 ， 但 是 ， 处 理 带 可 以 在 多 个 任务 之 间 周 期 性 地 切换 和 轮 
转 。 这 样 ， 它 们 部 处 于 走 走 集 信 的 状态 ， 快 速 的 处 理 上 融 加 上 局 效 的 任务 
切换 ， 在 外 界 看 来 ， 多 个 任务 都 在 同时 运行 中 。 

多 任务 系统 ， 对 任务 之 间 有 的 隅 离 和 保护 ， 以 及 任务 和 操作 系统 之 间 
的 隔离 和 你 护 部 提出 了 要 求 ， 这 可 以 看 做 对 段 保护 机 制 的 进一步 强化 。 
同时 ， 在 多 任务 系统 中 ， 操 作 系 统 夺 于 核心 软件 的 位 置 ， 为 各 个 任务 服 
务 ， 负 责任 务 的 加 载 、 创 建 和 执行 环境 的 管理 ， 并 执行 任务 之 则 的 调 
度 ， 对 操作 系统 的 你 护 显得 尤为 重要 。 事 实 上 ， 对 于 这 种 要 求 ， 基 本 的 
段 保 护 机 制 已 经 无 能 为 力 了 。 


纱 上 所 述 ， 本 草 的 学 习 目 标 是: 


1. 通过 演示 如 何 创建 一 个 任务 ， 并 使 之 投入 运行 来 学 习 任务 的 概念 
其 组 成 要 系 ， 包 括 任务 的 全 局 空间 和 局 部 空间 、TSS、LDT、 特 权 级 


慷 江 


2. 必须 了 解 特 别 级 不 是 指 任 务 的 特权 级 ， 而 是 指 组 成 任务 的 各 个 部 
分 的 特权 级 。 比 如 ， 任 务 的 全 局 部 分 一 般 是 0、1 和 2 特权 级 别 的 ， 任 务 
的 私有 部 分 一 般 是 3 特权 级 别 的 。 

3. 必须 清楚 CPL、DPL 和 RPL 的 含义 ， 以 及 不 同 特权 级 别 之 间 的 
控制 转移 规则 。 

4. 熟悉 调用 门 的 用 法 。 

5. 掌握 一 些 在 Bochs 下 调试 程序 的 新 手段 。 

6. 学 习 一 些 新 的 x86 处 理 具 指 令 ， 包 括 lldt、ltr、pushf/pushfd、 


popf/popfd、ret n/retf n、arpl 等 ， 同 时 ， 了 解 象 jmp 和 call 这 样 的 传统 指 
令 是 如 何 被 赋予 一 些 新 功能 的 。 


14.1 任务 的 隅 离 和 特权 级 保护 


14.1.1 任务 、 任 务 的 LDT 和 TSS 


程序 (Program) 是 记录 在 载体 上 的 指令 和 数据 ， 总 是 为 了 完成 某 个 
特定 的 工作 ， 其 正在 执行 中 的 一 个 副本 ， 叫 做 任务 (Task) 。 这 人 句 话 的 
意思 是 说 ， 如 果 一 个 程序 有 多 个 副本 正在 内 存 中 和 运行， 那么 ， 它 对 应 春 
多 个 任务 ， 每 一 个 副本 都 是 一 个 任务 。 在 上 一 章 里 ， 用 户 程序 束 是 任 
务 ， 而 内 核 程 序 琵 是 操作 系统 的 缩影 。 

一 百 以 来 ， 我 们 把 所 有 的 段 描述 人 符 都 履 在 GDT 中 ， 而 不 管 它 属于 内 
核 还 是 用 户 程序 。 如 图 14-1 所 示 ， 为 了 有 效 地 在 任务 之 则 实施 隔离 ， 处 
理 器 建议 每 个 任务 都 应 当 具 有 自己 的 描述 符 表 ， 称 为 局 部 描述 符 表 
LDT (Local Descriptor Table) ， 并 且 把 专属 于 目 己 的 那些 段 放 到 LDT 
中 。 

和 GDT 一 样 ，LDT 也 是 用 来 存放 描述 符 的 。 不 同 之 处 在 于 ，LDT 只 
属于 节 个 任务 。 或 者 说 ， 每 个 任务 都 有 目 己 的 LDT， 每 个 任务 私有 的 
段 ， 都 应 当 在 LDT 中 进行 描述 。 另 外 ，LDT 的 第 1 个 描述 符 ， 也 融 是 0 
号 槽 位 ， 也 是 有 效 的 、 可 以 使 用 的 。 


LDT 
GDT 的 基地 址 和 界限 | 
TS 





图 14-1 多 任务 系统 的 组 成 示意 图 


为 了 追踪 全 局 描述 符 表 (GDT) ， 访 问 它 内 部 的 描述 符 ， 处 理 器 使 
用 了 GDTR 寄存 占 。 这 是 可 以 理解 的 ， 正 如 其 名 称 所 上 暗示 的 那样 ， 全 局 
摘 述 符 表 (GDT) 是 全 局 性 的 ， 为 所 有 任务 服务 ， 是 它们 所 共有 的， 我 
们 只 需要 一 个 全 局 摘 述 符 表 (GDT) 束 够 了 。 

和 GDT 不 同 ， 局 部 描述 符 表 (LDT) 的 数量 则 不 止 一 个 ， 具 体 有 多 
少 ， 视 任务 的 多 少 而 定 。 为 了 追踪 和 访问 这 些 LDT， 处 理 器 使 用 了 局 部 
描述 符 表 寄存 器 (LDT Register: LDTR) 。 


竺 一 个 多 任务 的 系统 中 ， 会 有 很 多 任务 在 轮流 执行 ， 正 在 执行 中 的 
那个 任务 ， 称 为 当前 任务 (Current Task) 。 因 为 LDTR 寄存 器 只 有 一 
个 ， 所 以 ， 它 只 用 于 指向 当前 任务 的 LDT。 每 当 发 生 任 务 切换 时 ，LDTR 
的 内 容 被 更 新 ， 以 指向 新 任务 的 LDT。 和 GDTR 一 样 ，LDTR 包含 了 32 
位 线性 基地 址 字段 和 16 位 段 界限 字段 ， 以 指示 当前 LDT 的 位 置 和 大 小 。 





我 们 知道 ， 在 访问 内 存 之 前 需要 先 指定 一 个 段 ， 方 法 是 同 段 寄存 饥 
的 选择 器 传送 一 个 段 选 择 子 ， 这 称 为 “引用 一 个 段 *， 像 这 样 : 


moOY CTX, QO0008 


mov Qs， Cx 


回 到 第 11 章 ， 看 一 下 网 11-10， 段 选择 子 的 位 2 是 表 指 示 占 (Table 
Indicator: TI) ， 和 车 TI 二 0， 表 示 从 GDT 中 加 载 描 述 符 ; TI 二 1， 表 示 从 
当前 任务 的 LDT 中 加 载 描 述 符 。 

很 显然 ，0x0008 的 二 进 制 形式 为 0000 0000 0000 1000， 其 TI 位 是 
“0”， 所 以 ， 处 理 器 将 访问 GDT， 从 1 号 覃 位 取得 描述 符 ， 并 传送 到 段 寄 
存 器 DS 的 摘 述 符 高 速 绥 人 存 器 。 

再 看 这 个 例子 : 


moyv ex OUx00se 


mo ds ex 


0x005C 的 二 进 制 形式 为 0000 0000 0101 1100， 这 很 容易 看 出 TI 位 
是 “1”， 索 引号 为 11 (和 十进制 ) 。 处 理 器 执行 以 上 指令 时 ， 必 然 会 访问 当 
前 任务 的 LDT 〈 该 LDT 在 内 存 中 的 位 置 由 LDTR 指 定 ) ， 从 它 的 11 号 权 
位 取出 描述 从 ， 并 传送 到 上 段 寄 存 右 DS 的 描述 符 高 速 缓存 器 中 去 。 

很 显然 ， 因 为 段 选 择 子 是 16 位 的 ， 而 且 只 有 高 13 位 被 用 做 索引 号 来 
访问 GDT 或 者 LDT， 所 以 ， 每 个 LDT 所 能 容纳 的 描述 符 个 数 为 213， 即 
8192 个 。 或 者 换 句 话说 ， 每 个 LDT 只 能 定义 8192 个 段 。 又 因为 每 个 描 
述 符 的 长 度 是 8 字 节 ，LDT 的 长 度 最 大 为 64KB。 

竺 一 个 多 任务 的 环境 中 ， 当 任务 切换 发 生 时 ， 必 须 保 护 旧 任务 的 运 
行 状态 ， 或 者 说 是 保护 现场 ， 保 护 的 内 容 包 括 通用 寄存 右 、 段 寄存 右 、 
栈 指针 寄存 器 ESP、 指 令 指 针 寄 存 器 EIP、 状 态 寄存 器 EFLAGS， 等 等 。 
个 则 的 话 ， 等 下 次 该 任务 又 恢复 执行 时 ， 一 切 都 会 变 得 茫然 而 晕 无 头 
绪 。 

为 了 保存 任务 的 状态 ， 并 在 下 次 重新 执行 时 恢复 它们 ， 每 个 任务 都 
应 当 用 一 个 额外 的 内 存 区 域 保 存 相 关 信 息 ， 这 叫做 任务 状态 段 (Task 
State Segment: TSS) 。 如 图 14-2 所 示 ， 任 务 状 态 段 TSS 具有 固定 的 
格式 ， 最 小 尺寸 是 104 字 节 ， 图 中 所 标注 的 偏 移 量 是 十 进 制 的 。 处 理 


右 团 件 能 够 识别 TSS 中 的 每 个 元 聚 ， 并 在 任务 切换 的 时 候 读 取 其 中 的 信 
轧 ， 具 体 的 细节 将 在 后 面 讲述 。 

和 LDT 一 样 ， 处 理 需 用 TR 寄存 器 来 指 回 当前 任务 的 TSS 。 和 
GDTR、LDTR 一 样 ，TR 寄存 器 在 处 理 器 中 也 只 有 一 个 。 当 任务 切换 发 
生 的 时 候 ，TR 寄存 器 的 内 容 也 会 跟着 指 癌 新 任务 的 TSS。 这 个 过 程 是 这 
样 的 ， 首 先 ， 处 理 器 将 当前 任务 的 现场 信息 保存 到 由 TR 寄存 器 指向 的 
TSS; 然后 ， 再 使 TR 寄存 右 指 问 新 任务 的 TSS， 并 从 新 任务 的 TSS 中 恢 
复 现 场 。 

比较 奇怪 的 是 ， 为 什么 这 个 寄存 器 叫 TR， 而 不 是 TSSR。 原 因 很 简 
单 ，TSS 是 一 个 任务 存在 的 标志 ， 用 于 区 别 一 个 任务 和 其 他 任务 。 所 
以 ， 这 个 寄存 占 叫 做 任务 寄存 器 (Task Register: TR) 。 
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图 14-2”32 位 的 任务 状态 段 
14.1.2 全 局 空间 和 局 部 空间 


现代 的 计算 机 ， 如 条 没有 操作 系统 文 持 ， 它 也 可 以 在 编程 爱好 者 的 
操作 下 运行 得 很 好 ， 但 您 避 不 太 可 能 像 比 尔 : 亩 次 所 认为 的 那样 ， 每 个 果 
本 人 

人 在 多 任务 系统 中 ， 操 作 系 统 屑 负 看 任务 的 创建 ， 以 及 在 任务 之 间 调 


度 和 切换 的 工作 。 不 过 ， 更 为 楷 重 和 基础 的 工作 是 对 处 理 右 、 设 备 及 存 
储 硕 的 宫 理 。 


EDI 
ESI 
EBP 
ESP 
EBX 
EDX 
ECX 
EAX 
EIP 


从 程序 编写 者 的 角度 看 ， 操 作 系 统 古 他 们 可 以 信赖 的 朋友 。 前 先 ， 
他 们 不 必 关 心目 己 的 程序 是 如 何 加 载 到 内 存 并 开始 运行 的 ， 操 作 系 统 目 
然 会 处 理 好 这 些 事情 ; 其 次 ， 对 设备 的 访问 涉及 大 量 的 便 件 细节 ， 而 且 
极为 烦琐 ， 操 作 系 统 能 够 肩负 起 设备 官 理 的 职 贡 ， 并 提供 大 量 的 例 程 和 
数据 供应 用 程序 调用 。 使 用 操作 系统 提供 的 这 些 服 务 ， 可 以 极 大 地 简化 
程序 的 编号， 并 能 够 在 访问 设备 时 消除 潜在 的 苋 搜 和 冲突 。 

比如 说 ， 当 中 断 及 生 时 ， 不 可 能 由 菏 个 任务 来 进行 处 理 ， 而 只 能 由 
操作 系统 来 所 供 中 断 处 理 过 程 ， 并 采取 适当 的 操作 ， 以 进行 一 些 和 所 有 
任务 都 有 关系 的 全 局 性 管理 工作 ， 如 空 朵 内 存 的 查找 和 分 配 、 回 收 己 终 
止 任务 的 内 存 空间 、 设 备 访问 的 排队 和 调度 ， 等 等 。 

这 阮 是 说 ， 如 图 14-3 所 示 ， 每 个 任务 实际 上 包括 两 个 部 分 : 全 局 部 
分 和 私有 部 分 。 全 局 部 分 是 所 有 任务 共有 的 ， 含 有 操作 系统 的 软件 和 库 
程序 ， 以 及 可 以 调用 的 系统 服务 和 数据 ;私有 部 分 则 是 每 个 任务 各 目的 
数据 和 人 代码， 与 任务 所 要 解决 的 具体 问题 有 关 ， 彼 此 并 不 相同 。 
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(a) 每 个 任务 的 全 局 空间 和 局 部 空间 (b) 多 任务 系统 的 全 局 空间 和 局 部 空间 
图 14-3 ”任务 的 全 局 空间 和 局 部 空间 


任务 实际 上 和 是 在 内 存 中 运行 的 ， 所 以 ， 所 谓 的 全 局 部 分 和 私有 部 
分 ， 其 实 是 地 址 空间 的 划分 ， 即 全 局 地 址 空间 和 局 部 地 址 空间 ， 简 称 全 
局 空间 和 局 部 空间 。 


地 址 空间 的 访问 是 依 徘 分 段 机 制 来 进行 的 。 上 其 体 地 说 ， 需 要 先 在 插 
述 从 表 中 定义 各 个 段 的 手 述 从 ， 然 后 再 明 过 揪 述 从 来 访问 它们 。 因 此 ， 
全 局 地 址 空间 是 用 全 局 描述 符 表 (GDT) 来 指定 的 ， 而 局 部 地 址 空间 则 
是 由 每 个 任务 私有 的 局 部 描述 符 表 〈LDT) 来 定义 的 。 


从 程序 员 的 角度 来 看 ， 任 务 的 全 局 空间 包含 了 操作 系统 的 段 ， 是 由 
别人 编写 的 ， 但 是 他 可 以 调用 这 些 段 的 代码 ， 或 者 获取 这 些 段 中 的 数 
据 ; 任务 局 部 空间 的 内 容 是 由 程序 员 目 己 创 建 的 。 通 钊 ， 任 务 会 在 目 己 
的 局 部 空间 运行 ， 当 它 需 要 操作 系统 提供 的 服务 时 ， 转 入 全 局 空间 执 
全。 

我 们 知道 ， 段 寄存 器 (CS、SS、DS、ES、FS 和 GS) 由 16 位 的 选 
择 器 和 不 可 见 的 描述 符 高 速 缓存 器 组 成 。 选 择 器 的 位 2 是 表 指 示 器 TI， 和 若 
TI=0， 指 同 GDT， 表 示 当 前 正在 访问 的 段 摘 述 符 位 于 GDT 中 ; 否则 指 
回 LDT， 表 示 当 前 正在 访问 的 段 摘 述 符 位 于 LDT 中 。 选 择 需 的 高 13 位 指 
定 描述 符 的 索引 号 ， 也 惑 是 描述 人 符 在 描述 人 符 表 中 的 编号 ， 从 0 开始 。 

每 个 段 摘 述 符 都 对 应 着 一 个 内 存 段 。 很 显然 ， 在 一 个 任务 的 全 局 地 
址 空间 上 ， 可 以 划分 出 213 个 段 ， 也 束 是 8192 个 段 。 因 为 GDT 的 0 号 描 
述 符 不 能 使 用 ， 故 实际 上 是 8191 个 段 ， 但 这 无 关 紧 要 。 义 因为 段 内 偏 移 
是 32 位 的 ， 段 的 长 度 最 大 的 4GB， 因 此 ， 一 个 任务 的 全 局 地 址 空间 ， 其 
总 大 小 为 213 x232 一 245 字 节 ， 即 32TB。 

同样 的 道理 ， 局 部 描述 符 表 LDT 可 以 定义 213 个 ， 也 就 是 8192 个 描 
述 符 ， 每 个 段 的 最 大 长 度 也 是 4GB， 故 ， 一 个 任务 的 局 部 地 址 空间 为 213 
x232 一 245 字 节 ， 同 样 是 32TB。 


这 样 一 来 ， 每 个 任务 的 总 地 址 空间 为 22 十 2% 二 2% x2 二 2% x2 二 
2 字 记 ， 即 64TB。 在 一 个 只 有 32 根 地 址 线 的 处 理 郁 上， 无论 如 何 也 不 
可 能 提供 这 样 巨 大 的 存储 空间 ， 但 古 ， 丰 要案 张 ， 这 只 十 虚 假 的 ， 或 者 
说 虚拟 的 地 址 空间 。 操 作 系 统 允 许 程 序 的 编写 者 使 用 该 地 址 空间 来 瑟 程 
序 ， 即 ， 使 用 虚拟 地 址 或 者 逻辑 地 址 来 访问 内 存 ， 就 像 他 真 的 拥有 这 人 么 
巨大 的 地 址 空间 一 样 。 


上 面 一 段 话 可 以 这 样 理解 : 编 详 从 个 考 夸 处 理 豆 可 寻 址 空间 的 大 
小 ， 也 不 考 碟 物理 内 存 的 大 小 ， 它 只 是 负责 编 详 程序 。 当 程序 编 详 时 ， 
编译 占 允许 生成 非常 巳 大 的 程序 。 但 是 ， 妆 程序 超出 了 物理 内 存 的 大 小 
时 ， 或 者 操作 系统 无 法 分 配 这 么 大 的 物理 内 人 存 空 间 时 ， 怎 么 从 呢 ? 


同一 块 物理 内 存 ， 可 以 让 多 个 任务 ， 或 者 每 个 任务 的 不 同 段 来 使 
用 。 当 执行 或 者 访问 一 个 新 的 段 时 ， 如 果 它 不 在 物理 内 存 中 ， 而 且 也 没 
有 空闲 的 物理 内 存 空 间 来 加 载 它 ， 那 么 ， 操 作 系 统 将 挑 出 一 个 暂时 用 不 
到 的 段 ， 把 它 换 出 到 磁盘 中 ， 并 把 那个 腾 出 来 的 空间 分 配给 马上 要 访问 


的 段 ， 并 修改 段 的 摘 述 符 ， 便 之 指 同 这 段 内 存 空 间 。 下 一 次 ， 当 彼 换 出 
的 那个 段 马 上 又 要 用 到 时 ， 再 控 相 同 的 办 法 换 回 到 物理 内 存 。 所 有 这 一 
切 ， 任 务 〈 如 果 它 有 思维 有 的话) 和 程序 的 编写 痢 古 个 必 关 心 的 ， 这 就 古 
虚拟 内 存 管 理 的 一 般 方 法 。 


14.1.3 ”特权 级 保护 概述 


引入 LDT 和 TSS， 只 是 从 任务 层面 上 进一步 强化 了 分 段 机 制 ， 从 安 
全 你 障 的 角度 来 看 ， 只 相当 于 构建 了 了 可靠 的 便 件 设施 。 

当然 ， 仪 有 设施 古人 不够 的 ， 还 需要 规划 制度， 还 要 有 人 来 执行 ， 处 
理 项 也 一 样 。 为 此 ， 在 分 段 机 制 的 基础 上 ， 处 理 左 引入 了 特权 级 ， 并 由 
固件 负责 实施 特权 级 保护 。 


特权 级 〈Privilege Level) ， 也 叫 特权 级 别 ， 是 存在 于 摘 述 人 符 及 其 选 
择 子 中 的 一 个 数值 ， 当 这 些 描 述 符 或 者 选择 子 所 指 问 的 对 象 要 进行 某 种 
操作 ， 或 者 被 别 的 对 象 访问 时 ， 该 数值 用 于 控制 它们 所 能 进行 的 操作 ， 
或 者 限制 它们 的 可 访问 性 。 

Intel 处 理 器 可 以 识别 4 个 特权 级 别 ， 分 别 是 0 到 3， 较 大 的 数值 意味 
着 较 低 的 特权 级 别 ， 反 之 亦 然 。 如 图 14-4 所 示 ， 这 是 Intel 处 理 器 所 提供 
的 4 级 环 状 保护 结构 。 


通常 ， 因 为 操作 系统 是 为 所 有 程序 服务 的 ， 可 靠 性 最 高 ， 而 且 必 须 
对 软 人 硬件 有 完全 的 控制 权 ， 所 以 它 的 主体 部 分 必须 拥有 特权 级 0， 并 处 于 
整个 环形 结构 的 中 心 。 也 正 是 因为 这 样 ， 操 作 系 统 的 主体 部 分 通常 又 被 
称 做 内 核 (Kernel、Core) 。 


特权 级 1 和 2 通常 赋予 那些 可 靠 性 不 如 内 核 的 系统 服务 程序 ， 比 较 典 
型 的 就 是 设备 驱动 程序 。 当 然 ， 在 很 多 比较 流行 的 操作 系统 中 ， 驱 动 程 
序 与 内 核 的 特权 级 别 相 同 ， 都 是 0。 

应 用 程序 的 可 靠 性 被 视 为 是 最 低 的 ， 而 且 通 常 不 需要 直接 访问 硬件 
和 一 些 敏感 的 系统 资源 ， 调 用 设备 驱动 程序 或 者 操作 系统 例 程 就 能 完成 
绝 大 多 数 工 作 ， 故 赋予 它们 最 低 的 特权 级 别 3。 

实施 特权 级 保护 的 第 一 步 ， 是 为 所 有 可 管理 的 对 象 赋予 一 个 特权 
级 ， 以 决定 谁 能 访问 它们 。 回 到 第 11 章 ， 看 图 11-4。 图 中 ， 每 个 描述 符 
都 有 一 个 两 比特 的 DPL 字段 ， 可 以 取 值 为 00、01、10 和 11， 分 别 对 应 特 


权 级 0、1、2 和 3。DPL 征 每 个 描述 符 都 有 的 字段 ， 故 又 称 描述 符 特 权 级 
(Descriptor Privilege Level) 。 摘 述 符 总 是 指 回 它 所 摘 述 的 目标 对 象 ， 
代表 着 该 对 象 ， 因 此 ， 访 字段 实际 上 是 目标 对 象 的 特权 级 。 





图 14-4 ”处 理 紫 的 4 级 环 状 你 护 结构 


比如 ， 对 于 数据 段 来 说 ，DPL 决定 了 访问 它们 所 应 当 具 备 的 最 低 特 
权 级 别 。 如 果 有 一 个 数据 段 ， 其 摘 述 符 的 DPL 字段 为 2， 那 么 ， 只 有 特权 
级 为 0(、1 和 2 的 程序 才能 访问 它 。 当 一 个 特权 级 为 3 的 程序 也 试图 去 读 
写 该 段 时 ， 将 会 被 处 理 器 阻止 ， 并 引发 异常 中 断 。 对 任何 段 的 访问 都 要 
先 把 它 的 摘 述 符 加 载 到 段 寄 存 器 ， 所 以 这 种 保护 手段 很 容易 实现 。 

我 们 知道 ，32 位 处 理 器 的 段 架 存 右 ， 实 际 上 由 16 位 的 段 选择 占 和 描 
述 符 高 速 缓存 器 组 成 ， 而 且 后 者 是 不 能 直接 访问 的 。 正 因为 我 们 接触 不 
到 摘 述 符 高 速 缓存 匿 ， 所 以 ， 为 了 方便 ， 以 后 我 们 提 到 段 寄 存 左 的 时 
修 ， 指 的 就 是 段 选 择 器 。 

在 实 模式 下 ， 段 寄存 器 存放 的 是 段 地 址 ;而 在 保护 模式 下 ， 段 寄存 
锅 存 放 的 是 段 选择 子 ， 段 地 址 则 位 于 摘 述 符 高 速 缓存 器 中 。 当 处 理 右 正 
在 一 个 代码 段 中 取 指 令 和 执行 指令 时 ， 那 个 代码 段 的 特权 级 叫做 当前 特 
权 级 (Current Privilege Level，CPL ) 。 正 在 执行 的 这 个 代码 段 ， 其 选 
择 子 位 于 段 寄 存 问 CS 中 ， 其 最 低 两 位 就 古 当 前 特权 级 的 数值 。 


一 般 来 说 ， 操 作 系统 是 最 先 从 BIOS 那里 接收 处 理 器 控制 权 的 ， 进 入 
保护 模式 的 工作 也 是 由 它 做 的 ， 而 且 ， 最 重要 的 是 ， 它 还 肩负 着 整个 计 
算 机 系统 的 管理 工作 ， 所 以 ， 它 必须 工作 在 0 特权 级 别 上 ， 当 操作 系统 的 
代码 正在 执行 时 ， 当 前 特权 级 CPL 就 是 0。 


相反 ， 普 通 的 应 用 程序 则 工作 在 特权 级 别 3 上 。 没 有 人 愿意 将 目 己 的 
程序 放 在 特权 级 3 上 ， 但是， 只 要 你 在 某 个 操作 系统 上 面 写 程序 ， 这 就 由 
不 得 你 。 应 用 程序 编写 时 ， 不 需要 考虑 GDT、LDT、 分 段 、 搬 述 从 这些 
东西 ， 它 们 是 在 程序 加 载 时 ， 由 操作 系统 负责 创建 的 ， 应 用 程序 的 编写 
者 只 负责 具体 的 功能 束 可 以 了 。 应 用 程序 的 加 载 和 开始 执行 ， 也 是 由 操 
作 系 统 所 主导 的 ， 而 操作 系统 一 定 会 将 它 放 在 特权 级 3 上 。 当 应 用 程序 开 
始 执行 时 ， 当 前 特权 级 CPL 目 然 就 会 是 3。 

这 实际 上 束 是 把 一 个 任务 分 成 特权 级 截然 不 同 的 两 个 部 分 ， 全 局 部 
分 是 特权 级 0 的 ， 而 局 部 空间 则 是 特权 级 3 的 。 这 种 划分 是 有 好 处 的 ， 全 
局 空间 是 为 所 有 任务 服务 的 ， 其 重要 性 不 言 而 喻 。 为 了 保证 它 的 安全 
性 ， 并 能 够 访问 所 有 软 人 硬件 资源 ， 应 该 使 它 拥 有 最 高 的 特权 级 别 。 当 任 
务 在 目 己 的 局 部 空间 内 执行 时 ， 当 前 特权 级 CPL 是 3;， 当 它 通 过 调用 系统 
服务 ， 进 入 操作 系统 内 核 ， 在 全 局 空间 执行 时 ， 当 前 特权 级 CPL 就 变 成 
了 了 0。 总之， 很 重要 的 一 点 是 ， 不 能 僵化 地 看 竺 任务 和 任务 的 特权 级 别 。 


不 同 特权 级 别 的 程序 ， 所 担负 的 职责 以 及 在 系统 中 扮演 的 角色 是 不 
一 样 的 。 计 算 机 系统 的 脆弱 性 在 于 一 条 指令 就 能 改变 它 的 整体 运行 状 
态 ， 比 如 停机 指令 hlt 和 对 控制 寄存 器 CR0 的 写 操作 ， 像 这 样 的 指令 只 能 
由 最 高 特权 级 别 的 程序 来 人 做。 因此， 那些 只 有 在 当前 特权 级 CPL 为 0 时 
才能 执行 的 指令 ， 称 为 特权 指令 (Privileged Instructions) 。 典 型 的 特权 
指令 包括 加 载 全 局 描述 符 表 的 指令 lgdt( 它 在 实 模 式 下 也 可 执行 )、 加 载 
局 部 摘 述 人 符 表 的 指令 Ildt、 加 载 任务 寄存 器 的 指令 Itr、 旋 与 控制 寄存 堪 的 
mov 指令 、 停 机 指令 hlt 等 十 几 条 。 

除了 那些 特权 级 敏感 的 指令 外 ， 处 理 器 还 允许 对 各 个 特权 级 别 所 能 
执行 的 VO 操作 进行 控制 。 通 常 ， 这 指 的 是 并 口 访问 的 许可 权 ， 因 为 对 设 
备 的 访问 都 是 通过 端口 进行 的 。 如 图 14-5 所 示 ， 在 处 理 器 的 标志 寄存 器 
EFLAGS 中 ， 位 13、 位 12 是 IOPL 位 ， 也 就 是 输入 /输出 特权 级 (I/O 
Privilege Level) ， 它 代表 看 当前 任务 的 WO 特权 级 别 。 





图 14-5 ”EFLAGS 寄存 器 中 的 IOPL 位 


任务 是 由 操作 系统 加 载 和 创建 的 ， 与 任务 相关 的 信息 都 在 它 目 己 的 
任务 状态 段 (TSS) 中 ， 其 中 束 包 括 一 个 EFLAGS 寄存 右 的 副本 ， 用 于 
指示 与 当前 任务 相关 的 机 器 状态 ， 比 如 它 自己 的 MO 特权 级 IOPL。 在 多 任 
务 系统 中 ， 随 看 任务 的 切换 ， 前 一 个 任务 的 所 有 状态 被 保存 到 它 目 己 的 
TSS 中 ， 新 任务 的 各 种 状态 从 其 TSS 中 恢复 ， 包 括 EFLAGS 寄存 器 的 
值 。 


处 理 器 不 限制 0 特权 级 程序 的 MO 访问 ， 它 总 是 允许 的 。 但 是 ， 可 以 
限制 低 特权 级 程序 的 MO 访问 权限 。 这 是 很 重要 的 ， 操 作 系 统 的 功能 之 一 
是 设备 官 理 ， 它 可 能 不 布 望 应 用 程序 拥有 私 目 访问 外 设 的 能 

代码 段 的 特权 级 检查 是 很 严格 的 。 一 般 来 说， 控制 转移 只 人 允许 发 生 
在 两 个 特权 级 相同 的 代 但 段 乙 间 。 如 束 当 前 特权 级 为 2， 那 么 ， 它 可 以 转 
移 到 万 一 个 DPL 为 2 的 代 人 码 段 接 看 执行 ， 但 个 允许 转移 到 DPL 为 0、1 和 
3 的 代码 段 执 行 。 不 过 ， 为 了 让 特权 级 低 的 应 用 程序 可 以 调用 特权 级 高 的 
操作 系统 例 程 ， 处 理 帮 也 提供 了 相应 的 解决 办 法 。 


第 一 种 方法 古 将 蜗 符 权 级 的 代 公 段 定义 为 依从 的 。 回 到 第 11 章 ， 在 
那 一 章 里 ， 表 11-1 给 出 了 段 摘 述 符 的 TYPE 字段 。 代 人 码 段 插 述 从 的 TYPE 
字段 有 C 位 ， 如 条 C=0， 这 样 的 代码 段 只 能 供 同 特权 级 的 程序 使 用 ;个 
则 ， 如 果 C 三 1， 则 这 样 的 代 人 码 段 称 为 依从 的 代码 段 ， 可 以 从 特权 级 比 它 
低 的 程序 调用 并 进入 。 


但 是 ， 即 使 是 将 控制 转移 到 依从 的 代码 段 ， 也 是 有 条 件 的 ， 要 求 当 
前 特权 级 CPL 必须 低 于 ， 或 者 和 目标 代 人 码 段 手 述 从 的 DPL 相同 。 即 ， 在 
数值 上 ， 


CPL 宇 目标 代码 段 描述 符 的 DPL 


举例 来 说， 如 来 一 个 依从 的 代码 段 ， 其 插 述 从 的 DPL 为 1， 则 只 有 特 
权 级 列 为 1、2、3 的 程序 可 以 调用 ， 而 特权 级 为 0 的 程序 则 不 能 。 在 任何 
时 候 ， 都 不 允许 将 控制 从 较 遍 的 特权 级 转移 到 较 低 的 特权 级 。 


依从 的 代 人 码 段 不 是 在 它 的 DPL 特权 级 上 运行 ， 而 征 在 调用 程序 的 特 
权 级 上 运行 。 束 是 说 ， 当 控制 转移 到 依从 的 代码 段 上 执行 时 ， 不 改变 当 
前 特权 级 CPL， 段 寄存 器 CS 的 CPL 字段 不 发 生变 化 ， 被 调用 过 程 的 特权 
级 依从 于 调用 者 的 特权 级 ， 这 吏 是 为 什么 它 被 称 为 "依从 的 "代码 段 。 


除了 依从 的 代 担 段 ， 万 一 种 在 特权 级 之 间 转 移 控 制 的 方法 是 使 用 
1]。1] (Gate) 十 万 一 种 形 陈 的 持 述 符 ， 称 为 门 描述 符 ， 人 简称 门 。 和 段 
摘 述 符 不 同 ， 段 持 述 符 用 于 描述 内存 段 ， 门 描述 符 则 用 于 扫 述 可 执行 的 
代码 ， 比 如 一 段 程序 、 一 个 过 程 〈 例 程 ) 或 者 一 个 任务 。 

事 际 上 ， 根 据 不 同 的 用 途 ， 门 的 类 型 有 好 几 种 。 不 同 特权 级 之 则 的 
过 程 调用 可 以 使 用 调用 门 ， 中断 门 /陷阱 门 是 作为 中 断 处 理 过 程 使 用 的 : 
任务 门 对 应 看 单个 的 任务 ， 用 来 执行 任务 切换 。 在 本 章 里 ， 我 们 重点 介 
绍 的 是 调用 1] (Call Gate) 。 


所 有 摘 述 符 都 是 64 位 的 ， 调 用 门 措 述 符 也 不 例外 。 在 调用 门 描述 符 
中 ， 定 义 了 目标 过 程 〈 例 程 ) 所 在 代 但 段 的 选择 子 ， 以 及 段 内 俩 移 。 要 
想 通 过 调用 门 进 行 控制 转移 ， 可 以 使 用 mp far 或 者 call far 指令 ， 并 把 调 
用 门 摘 述 符 的 选择 子 作为 操作 数 。 

使 用 jmp far 指令 ， 可 以 将 控制 通过 门 转移 到 比 当 前 特权 级 高 的 代码 
段 ， 但 不 改变 当前 特权 级 别 。 但 是 ， 如 果 使 用 call far 指令 ， 则 当前 特权 
级 会 提升 到 目标 代码 段 的 特权 级 别 。 也 束 是 说 ， 处 理 器 是 在 目标 代码 段 
的 特权 级 上 执行 的 。 但 是 ， 除 了 从 蜗 特 权 级 别 的 例 程 (通常 是 操作 系统 
例 程 ) 返回 外 ， 不 允许 从 特权 级 高 的 代码 段 将 控制 转移 到 特权 级 低 的 代 
人 码 段 ， 因 为 操作 系统 不 会 引用 可 菲 性 比 目 己 低 的 代 但 。 

说 了 这 么 多 ， 好 像 这 是 我 们 头 一 回 接触 特权 级 似 的 。 

事实 上 ， 它 是 老 朋 友 了 ， 从 第 11 章 我 们 写 第 一 个 保护 模式 程序 开 
始 ， 我 们 束 在 创建 DPL 为 0 的 摘 述 符 ， 只 不 过 从 来 没有 同 大 家 介绍 。 远 的 
就 不 说 了 ， 就 说 上 一 章 ， 也 就 是 第 13 章 ， 这 一 章 比 较 典 型 ， 既 有 内 核 程 
序 ， 也 有 用 户 程 序 〈 应 用 程序 ) 。 

参见 代码 清单 13-1， 也 就 是 源 程 序 c13 _mbrasm， 第 24 一 37 行 ， 创 
建 了 初始 的 儿 个 段 摘 述 符 : 

;创建 1# 描 述 符 ， 这 是 一 个 数据 段 ， 对 应 0~4GB 的 线性 地 址 空间 
mov dword [ebx+0x08],0x0000ffff ; 基地 址 为 0， 段 界限 为 0xFFFFF 


mov dword [ebx+0x0c],0x00cf9200 ;粒度 为 4KB， 数 据 段 ，DPL=00 


; 创建 保护 模式 下 初始 代码 段 描述 符 
mov dword [ebx+0x10],0x7c0001fE ; 基地 址 为 0x7C00， 界 限 0x1FF 
mov dword [ebx+0x14],0x00409800 ;粒度 为 字 节 ， 代 码 段 ，DPL=00 


;建立 保护 模式 下 的 栈 段 描述 符 
mov dword [ebx+0x18] ,0x7c00fffe ; 基地 址 为 0x7C00， 界 限 0xFFFFE 
mov dword [ebx+0xlc],0x00cf9600 ;粒度 为 4KB， 栈 段 ，DPL=00 





:建立 保护 模式 下 的 显示 缓冲 区 摘 述 符 
mov dwordq [ebx+0x20],0x80007fff ; 基地 址 为 0xB8000， 界 限 0x07FFF 
mov dword [ebx+0x24],0x0040920b ;粒度 为 学 三 ， 数 据 段 ，DPL=00 


注意 代 公 中 的 粗 体 部 分 ， 对 照 一 下 上段 拍 述 从 的 格式 ， 你 会 友 现 ， 这 
些 段 拍 述 符 的 DPL 都 十 0。 也 融 是 说 ， 我 们 将 这 些 段 的 特权 级 定 为 最 高 级 
串 。 

特权 级 保护 机 制 只 在 保护 模 陈 下 才能 月 用 ， 而 进入 保护 模式 的 方法 
是 设置 CR0 寄存 右 的 PE 位 。 而 且 ， 处 理 民 建议， 在 进入 保护 模式 后 ， 执 
行 的 第 一 条 指令 应 当 古 跳 转 或 者 过 程 调 用 指令 ， 以 请 空 流 水 线 和 乱 序 执 
行 的 结束 ， 并 串 行 化 处 理 戎 ， 束 像 这 样 : 


JInmB Sword 0x0010:f1lush 


转移 到 的 目标 代码 段 是 刚刚 定义 过 的 ， 拉 述 符 特 权 级 DPL 为 0。 要 将 
控制 转移 到 这 样 的 代码 段 ， 当 前 特权 级 CPL 必须 为 0。 不 过 ， 这 并 不 是 问 
题 。 进 入 傈 护 模 式 之 后 ， 处 理 礁 目 动 将 当前 特权 级 CPL 设 定 为 0， 以 0 特 
权 级 的 身份 开始 执行 剑 护 模式 的 初始 指令 。 


参见 第 11 章 里 的 图 11-10， 段 选择 子 实际 上 由 三 部 分 组 成 ， 分 别 是 描 
述 符 的 索引 号 、 表 指示 器 TI 和 RPL 字段 。 在 以 上 指令 中 ， 段 选择 子 
0x0010 的 TI 位 是 0， 意 味 着 目标 代码 段 的 描述 符 在 GDT 中 。 该 选择 子 索 
引 字段 的 值 是 2， 指 向 (GDT 中 的 ) 2 号 描述 符 。 

GDT 中 的 1 亏 描 述 符 是 保护 模式 下 的 初始 代码 段 描述 符 ， 特 权 级 
DPL 为 0， 而 当前 特权 级 CPL 也 是 0， 从 初始 的 0 特权 级 转移 到 另 一 个 0 
特权 级 的 代码 段 ， 这 是 允许 的 。 转 移 之 后 ，jmp 指令 中 的 选择 子 0x0010 


伞 加 载 到 段 寄 存 器 CS， 其 低 两 位 采用 目标 代码 段 摘 述 符 DPL 的 仁 。 也 束 
是 说 ， 控 制 转移 之 后 ， 当 前 特权 级 仍 为 0。 

这 里 遗漏 了 一 样 东 西 ， 尺 官 它 对 于 处 理 右 的 符 权 级 检查 来 说 很 重 
要 ， 但 更 多 的 时 候 是 个 昧 车 。 那 承 是 选择 子 中 的 RPL 字段 。 

RPL 的 意思 是 请 求 特权 级 Requested Privilege Level) 。 我 们 知 
道 ， 要 将 控制 从 一 个 代码 段 转移 到 另 一 个 代码 段 ， 通 利 是 使 用 mp 和 call 
指令 ， 并 在 指令 中 提供 目标 代 但 段 的 选择 子 ， 以 及 段 内 伺 移 量 〈《 入 口 
点 ) 。 而 为 了 访问 内 存 中 的 数据 ， 也 必须 先 将 段 选 择 子 加 载 到 上 段 哥 和 存 右 
DS、ES、FS 或 者 GS 中 。 不 过 是 实施 控制 转移 ， 还 是 访问 数据 段 ， 这 
都 可 以 看 成 是 一 个 请 求 ， 请 求 者 提供 一 个 段 选 择 子 ， 请 求 访问 指定 的 
段 。 从 这 个 意义 上 来 襄 ，RPL 也 束 古 指 请 求 者 的 符 权 级 别 (Requestor’s 
Privilege Level) 。 

在 绝 大 多 数 时 候 ， 请 求 者 部 是 当前 程序 自己 ， 因此，CPL 二 RPL。 
要 判断 请 求 者 古 谁 ， 最 位 蛙 的 方法 束 古 看 谁 提 供 了 选择 子 。 以 下 是 两 个 
典型 的 例子 : 

代码 清单 13-1 中 的 第 55 行 : 


me dword Ox0010sf1lush 
在 这 里 ， 提 供 选 择 子 0x0008 的 是 当前 程序 目 己 。 
再 比如 同一 代码 清单 中 的 第 59、60 行 : 


mov eax, Ox0008 :加载 数 据 段 (0 一 4GB ) 选择 子 


mov ds,eax 
非常 清楚 的 是 ， 这 同样 是 当前 程序 自己 拿 厦 段 选 择 子 0x0008 来 “请 
求 " 代 入 段 寄存 如 DS， 以 便 在 随后 的 指令 中 访问 该 段 中 的 数据 。 
但 是 ， 在 一 些 并 不 多 见 的 情况 下 ，RPL 和 CPL 并 不 相同 。 如 图 14-6 


所 示 ， 特 权 级 为 3 的 应 用 程序 希望 从 人 硬盘 读 一 个 山区 ， 并 传送 到 自己 的 数 
据 段 ， 因 此 ， 数 据 段 揪 述 从 的 DPL 同样 会 是 3。 


村 权 级 3 
Hi 应 用 程序 


数据 段 选择 子 ，RPL= 王 3 
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图 14-6 请求 符 权 级 RPL 和 当前 特权 级 CPL 不 相同 的 例子 


由 于 1/O 特权 级 的 限制 ， 应 用 程序 无 法 目 己 访问 便 稚 。 好 在 位 于 0 特 
权 级 的 操作 系统 提供 了 相应 的 例 程 ， 但 必须 通过 调用 门 才能 使 用 ， 因 为 
特权 级 间 的 控制 转移 必须 通过 门 。 假 设 ， 通 过 调用 门 使 用 操作 系统 例 程 
时 ， 必 须 传 入 3 个 参数 ， 分 别 是 CX 寄存 器 中 的 数据 段 选择 子 、EBX 和 寄存 
器 中 的 段 内 偏 移 ， 以 及 EAX 中 的 逻辑 扇 区 号 。 


融 特 权 级 列 的 程序 可 以 访问 低 特 权 级 别 的 数据 段 ， 这 古 没 有 问题 
的 。 因 此 ， 操 作 系 统 例 程 会 用 传 入 的 数据 段 选择 子 代 入 段 寄 人 存 疹 ， 以 便 
代 蔡 应 用 程序 访问 那个 段 : 


mo ds, TX 


在 执行 这 条 指令 时 ，CX 寄存 硕 中 的 段 选择 了 于， 其 RPL 字段 的 值 是 
3， 妆 前 特权 级 CPL 已 经 变 成 0， 因 为 通过 调用 门 实施 控制 转移 可 以 改变 
当前 特权 级 。 显 然 ， 请 求 者 并 非 当 前 程序 ， 而 是 特权 级 为 3 的 应 用 程序 ， 
RPL 和 CPL 并 不 相同 。 

不 过 ， 上 和 面 的 例子 只 是 表明 RPL 有 可 能 和 CPL 并 不 相同 ， 但 并 没有 
说 明 引 入 RPL 到 压 有 什么 必要 性 ， 它 似乎 是 多 余 的 ， 没 有 它 ， 程 序 也 能 
下 第 工作 ， 不 是 吗 ? 如 下 你 是 这 样 想 的 ， 那 束 来 看 看 下 和 面 这 个 例子 。 


如 图 14-7 所 示 ， 人 次 的 可 恶 之 处 是 无 扎 不 入 ， 总 爱 负 空 于 。 想 象 一 
下 ， 应 用 程序 的 编写 者 通过 销 研 ， 知 站 了 操作 系统 数据 段 的 选择 子 ， 而 
且 布 望 用 这 个 选择 子 访问 操作 系统 的 数据 段 。 当 然 ， 他 不 可 能 在 应 用 程 
序 里 访问 操作 系统 数据 段 ， 因 为 那个 数据 段 的 DPL 为 0， 而 应 用 程序 工作 
时 的 当前 特权 级 为 3， 处 理 融 会 很 机 管 地 把 来 访 者 拒 之 门 外 。 
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图 14-7 ”在 特权 级 检查 中 引入 RPL 的 必要 性 


但 是 ， 他 可 以 借助 于 调用 门 。 调 用 门 工作 在 目标 代码 段 的 特权 级 
上 , 一旦 处 理 器 的 执行 流离 开 应 用 程序 ， 通 过 调用 门 进 入 操作 系统 例 程 
上 时， 当前 特权 级 从 3 变 为 0。 当 那个 不 怀 好 意 的 程序 将 一 个 指 癌 操作 系统 
数据 段 的 选择 子 通过 CX 寄存 器 作为 参数 传 入 调用 门 时 ， 因 为 当前 特权 级 
已 经 从 3 变 为 0， 可 以 从 硬盘 读 出 数据 ， 并 且 人 允 许 回 操作 系统 数据 段 瑟 入 
局 区 数据 ， 他 得 运 了 ! 


处 理 器 的 智商 很 低 ， 它 不 可 能 知道 谁 是 真正 的 请 求 者 。 作 为 最 聪明 
的 灵 长 闫 动物， 你 当然 可 以 通过 分 析 程 序 的 行为 来 区 分 它们 ， 但 处 理 套 
不 能 。 因 此 ， 当 指令 
mov ds,ax 


或 者 


moOv ds CC 





执行 时 ，AX 或 者 CX 寄存 右 中 的 选择 子 可 能 是 操作 系统 目 己 提 供 的 ， 也 
可 能 来 目 于 恶意 的 用 户 程 序 ， 这 两 种 情况 要 区 别 对 符 ， 但 已 经 超出 了 处 
理 硕 的 能 力 和 职权 范围 。 

片 么 从 ? 


看 得 出 来 ， 单 纯 依 靠 处 理 喜 便 件 无 法 解决 这 个 难题 ， 但 它 可 以 在 原 
来 的 基础 上 多 增加 一 种 检 奏 机 制 ， 并 把 如 何 能 够 通过 这 种 检查 的 目 由 裁 
量 权 交 给 软件 《的 编写 者 ) 。 

引入 请 求 特权 级 CRPL ) 的 原因 是 处 理 占 在 过 到 一 条 将 选择 子 传送 
到 段 寄 存 器 的 指令 时 ， 无 法 区 分 真正 的 请 求 者 是 谁 。 但 是 ， 引 入 RPL 本 
身 并 不 能 完全 解决 这 个 问题 ， 这 只 是 处 理 器 和 操作 系统 之 间 的 一 种 协 
议 ， 处 理 器 负责 检查 请 求 特权 级 RPL， 判 断 它 是 否 有 权 访 问 ， 但 前 提 是 
提供 了 正确 的 RPL; 内 核 或 者 操作 系统 负 员 鉴别 请 求 者 的 身份 ， 并 有 义 
务 保证 RPL 的 值 和 它 的 请 求 者 号 份 相符 ， 因 为 这 是 处 理 右 无 能 为 力 的 。 

因此 ， 在 引入 RPL 这 件 事 上 ， 处 理 器 的 潜台词 是 ， 仅 依靠 现 有 的 
CPL 和 DPL， 无 法 解决 由 请 求 者 不 同 而 带 来 的 安全 隐患 。 那 么 ， 好 吧 ， 
册 增 加 一 道门 卫 ， 但 前 提 是 ， 操 作 系 统 只 将 通行 证 发 放 给 正确 的 人 。 

操作 系统 的 编写 者 很 清楚 段 选择 子 的 来 源 ， 即 ， 真 正 的 请 求 者 是 
谁 。 当 它 目 己 读 与 一 个 段 时 ， 这 没有 什么 好 说 的 ; 当 它 提供 一 个 服务 例 
程 时 ，3 特权 级 别 的 用 户 程序 给 出 的 选择 子 在 哪里 ， 也 是 由 它 定 的 ， 它 也 
知道 。 在 这 种 情况 下 ， 它 所 要 做 的 ， 就 是 将 该 选择 子 的 RPL 字段 设置 为 
请 求 者 的 特权 级 (可 以 使 用 arpl 指令 ， 将 在 本 章 的 后 面 介绍 ) 。 剩 下 的 
工作 天 看 处 理 避 了。 每 当 处 理 喜 执行 一 个 将 段 选择 子 传送 到 段 寄 存 需 
(DS、ES、FS、GS) 的 指令 ， 比 如 : 


时 ， 会 检查 以 下 两 个 条 件 是 个 都 能 满足 。 

e 当前 特权 级 CPL 高 于 或 者 和 数据 段 搞 述 符 的 DPL 相同 。 即 ， 在 数 
值 上 ，CPL< 数 据 段 摘 述 符 的 DPL ; 

e 请 求 特 权 级 RPL 高 于 或 者 和 数据 段 描述 符 的 DPL 相同 。 即 ， 在 数 
值 上 ，RPL< 数 据 段 搞 述 符 的 DPL 。 

如 果 以 上 两 个 条 件 不 能 同时 成 立 ， 处 理 器 就 会 阻止 这 种 操作 ， 并 引 
发 异 遇 中断 。 


按照 Intel 公司 的 说 法 ， 引 入 RPL 的 意图 是 “确保 特权 代码 不 会 代 桨 应 
用 程序 访问 一 个 段 ， 除 非 应 用 程序 目 己 拥有 访问 那个 段 科 权限 ，。 多 数 读 
者 部 只 在 字面 上 理解 这 人 句 话 的 意思 ， 而 没有 意识 到 ， 这 人 句 话 只 是 如 实地 
接 述 了 处 理 右 目 己 的 工作 ， 并 没 有 借 证 宅 可 以 鉴别 RPL 的 有 效 性 。 


最 后 ， 我 们 来 总 结 一 下 基本 的 特权 级 检查 规则 。 
首先 ， 将 控制 直接 转移 到 非 依 从 的 代码 段 ， 要 求 当前 特权 级 CPL 和 
请 求 特 权 级 RPL 都 等 于 目标 代码 段 描述 符 的 DPL。 即 ， 在 数值 上 ， 


CPIL 三 目标 代码 段 描述 符 的 DPL 
RPIL 王 目标 代码 段 摘 述 符 的 DPL 


一 个 典型 的 例子 融和 是 使 用 jmp 指令 进行 控制 转移 : 
jmp 0x0012:0x00002000 


因为 两 个 代码 段 的 特权 级 相同 ， 故 ， 转 移 后 当前 特权 级 不 变 。 

其 次 ， 要 将 控制 直接 转移 到 依从 的 代码 段 ， 要 求 当前 特权 级 CPL 和 
请 求 特 权 级 RPL 都 低 于 ， 或 者 和 目标 代码 段 描述 符 的 DPL 相同 。 即 ， 在 
数值 上 ， 


CPL 宇 目标 代码 段 摘 述 符 的 DPL 
RPL 过 目标 代码 段 描述 符 的 DPL 


控制 转移 后 ， 当 前 特权 级 保持 不 变 。 

通过 门 实施 的 控制 转移 ， 其 特权 级 检查 规则 将 在 相应 的 章节 里 话 
述 。 

第 三 ， 高 特权 级 别 的 程序 可 以 访问 低 特 权 级 别 的 数据 段 ， 但 低 特 权 
级 别 的 程序 不 能 访问 高 特权 级 别 的 数据 段 。 访 问 数 据 段 之 前 ， 肯 定 要 对 
段 寄 存 器 DS、ES、FS 和 GS 进行 修改 ， 比 如 


mov fs,ax 


在 这 个 时 候 ， 要 求 当前 特权 级 CPL 和 请 求 特 权 级 RPL 都 必须 高 于 ， 
或 者 和 目标 数据 段 手 述 从 的 DPL 相同 。 即 ， 在 数值 上 ， 


CPIL 科 目标 数据 段 描述 符 的 DPL 
RPIL 乏 目标 数据 段 摘 述 符 的 DPL 


最 后 ， 处 理 占 要 求 ， 在 任何 时 候 ， 栈 段 的 特权 级 列 必须 和 当前 特权 
级 CPL 相同 。 因 此 ， 随 看 程序 的 执行 ， 要 对 段 寄 和 存 右 SS 的 内 容 进行 修改 
时 ， 必 须 进行 特权 级 检查 。 以 下 就 是 一 个 修改 段 寄存 占 SS 的 例子 : 


INOV OSrox 


在 对 段 寄 存 器 SS 进行 修改 时 ， 要 求 当前 特权 级 CPL 和 请 求 特 权 级 
RPL 必须 等 于 目标 栈 段 朱 述 符 的 DPL。 即 ， 在 数值 上 ， 


CPIL 三 目标 栈 段 描述 符 的 DPL 
RPIL 三 目标 栈 段 描述 符 的 DPL 


0 特权 级 是 最 高 的 特权 级 别 ， 当 一 个 系统 的 各 个 部 分 都 位 于 0 特权 级 
时 ， 各 种 特权 级 检查 总 能 够 获得 通过 ， 束 像 这 种 和 丛 碍 和 检验 并 不 人 存在 一 
样 。 所 以 ， 处 理 融 的 设计 着 建议 ， 如 末 不 需要 使 用 特权 机 制 的 话 ， 可 以 
将 所 有 程序 的 特权 级 列 部 设置 为 0， 丈 像 我 们 一 耳 所 做 的 那样 。 


小 结 


1.， 程 序 员 在 与 程序 时 ， 不 需要 指定 特权 级 别 。 当 程序 运行 时 ， 操 作 
系统 将 程序 创建 为 任务 局 部 空间 的 内 容 ， 并 赋予 较 低 特权 级 列 ， 比 如 3， 
操作 系统 对 应 看 任务 全 局 空间 的 内 容 。 如 末 有 多 个 任务 ， 则 操作 系统 属 
于 所 有 任务 的 公共 部 分 。 

2. 当 任 务 运行 在 局 部 空间 时 ， 可 以 在 各 个 段 之 间 转 移 控制 ， 并 访问 
私有 数据 ， 因 为 它们 有 具有 相同 的 特权 级 列 ， 但 不 允许 下 接 将 控制 转移 到 
融 特 权 级 别 的 全 局 空间 的 段 ， 除 非 通 过 调用 门 ， 或 痢 目 标 段 是 依从 的 代 
但 段 。 


3. 当 通 过 调用 门 进入 全 局 空间 执行 时 ， 拘 作 系 统 可 以 在 全 局 空间 入 
的 各 个 段 之 间 转 移 控制 并 访问 数据 ， 因 为 它们 也 上 其 有 相同 的 特权 级 别 。 
同时 ， 操 作 系 统 还 可 以 访问 任务 局 部 空间 的 数据 ， 即 低 特权 级 列 的 数据 
段 。 但 除了 调用 门 返回 外 ， 不 允许 将 控制 转移 到 低 特权 级 列 的 局 部 空间 
由 的 代码 段 。 


4.， 任何 时 候 ， 当 前 栈 的 特权 级 别 必 须 和 CPL 是 一 样 的 。 进 入 不 同 
特权 级 别 的 段 执行 时 ， 要 切换 栈 ， 这 是 以 后 要 讲述 的 内 容 。 


检测 点 14.1 
1. 选择 填空 : x86 处 理 需 提供 了 4 个 特权 级 别 0、1、2 和 3。 较 小 
的 数字 拥有 较 〈 ) 的 特权 级 别 ， 其 中 3 特权 级 是 最 〈 ) 的 低 权 级 别 。 可 
2 将 控制 转移 到 另 一 个 代码 段 时 ， 如 果 目 标 段 不 是 依从 的 ， 并 且 转 
移 时 不 通过 门 ， 则 CPL 、RPL 和 DPL 之 间 的 关系 必须 符合 
的 条 件 ; 如 果 目 标 段 是 依从 的 ， 则 必须 符合 
的 条 件 。 
3. ”如果 当前 特权 级 别 CPL 为 2， 那 么 ， 它 可 以 访问 DPL 为 
的 数据 段 。 


14.2 ”代码 清单 14-1 





14.3 内核 程序 的 初始 化 


本 和 章 没 有 提供 主 引导 程序 ， 因 为 我 们 要 继续 使 用 上 一 重 的 主 引导 程 
序 。 毕 葛 ， 主 引导 程序 只 是 用 来 加 载 内 核 程 序 ， 并 执行 前 期 的 内 核 初始 
化 工作 。 主 引导 程序 工作 在 0 特权 级 。 

现在 ， 让 我 们 来 分 析 本 和 章 代 但 清单 14-1， 这 征 前 一 草 内 核 程 序 的 修 
改版 本 ， 使 用 了 任务 、LDT、TSS 和 特权 级 等 最 新 的 处 理 夯 特性 和 工作 
机 制 。 代 码 清单 中 ， 一 开始 的 名 数 定义 以 及 程序 头 部 的 格式 和 前 一 重 也 
完全 相同 ， 这 十 可 以 理解 的 ， 作 为 主 引 寻 程 序 和 内 核 程 序 的 协议 部 分 ， 
它们 总 应 该 是 稳定 不 变 的 。 

文件 起 始 部 分 的 第 数 定义 了 内 核 所 有 段 的 选择 子 。 很 显然 ， 这 些 选 
择 子 的 RPL 字段 部 是 0， 内 核 请 求 访问 目 己 的 段 ， 请 求 特权 级 应 当 为 0。 

内 核 的 入 口 扩 在 第 775 行 。 在 执行 到 这 里 的 时 候 ， 主 引 叶 程序 已 经 
加 载 了 内 核 ， 并 对 它 进行 了 前 期 的 初始 化 工作 。 

因为 加 载 的 是 内 核 程序 ， 和 而 内 核 应 当 工 作 在 0 特权 级 ， 所 以 主 引 了 叶 程 
序 在 初始 化 内 核 时 ， 所 创建 的 招 述 符 ， 其 目标 特权 级 DPL 部 为 0， 如 图 
14-8 所 示 。 注 意 ， 这 些 插 述 从 部 是 在 GDT 中 创建 的 ， 图 中 左边 是 各 拍 述 
从 在 GDT 中 的 偶 移 量 ， 右 边 是 各 个 摘 述 符 的 选择 子 。 


GDT 内 偶 移 描述 符 索 引号 


核心 代码 段 〈 位 置 和 长 度 不 定 ，DPL=0) 38 
Pe™ 核心 数据 段 ( 位 置 和 长 度 不 定 ，DPL = 二 0) 30 
本 公用 例 程 段 《00040000 一 长 度 不 定 ，DPL=0) 28 


文本 模式 显存 (000B8000 一 000BFFFF，DPL=0) 20 


图 14-8 内核 加 载 完成 后 的 GDT 布局 


这 些 揪 述 从 所 指 回 的 段 ， 有 的 是 代 人 码 段 ， 有 的 是 数据 段 。 如 来 是 数 
据 段 ， 则 只 有 内 核 目 己 才能 访问 ， 因 为 其 手 述 从 的 DPL 是 0， 低 特权 级 别 
的 程序 访问 这 些 段 时 ， 会 被 阻止 以 防 出 现 安 全 问题 ， 如 果 是 代码 段 ， 则 
通 归 只 有 0 特权 级 的 程序 才能 将 控制 转移 到 访 段 ， 也 惑 是 说 ， 只 能 从 内 核 
其 他 正在 执行 的 部 分 转移 a 到 该 段 执 行 ， 因 为 它们 的 特权 级 列 相 同 。 

第 779 一 809 行 ， 用 于 在 屏 帮 上 显示 初始 的 信息 ， 包 括 一 个 欢迎 信息 
和 一 个 处 理 左 品牌 信息 。 


14.3.1 调用 门 


在 上 一 革 里 ， 内 梯 的 主要 功能 十 加 载 和 章 定 位 用 户 程 序 ， 并 将 处 理 
名 的 控制 权 移 区 过 去 。 用 户 程 序 执行 完毕 ， 偿 要 童 新 回收 控制 。 现 在 我 
们 已 经 知道 ， 在 上 一 章 里 ， 内 核 赋 予 用 尸 程 序 的 特权 级 别 是 0， 所 以 用 户 
程序 是 在 0 特权 级 上 运行 的 。 也 正 是 因为 如 此 ， 当 用 户 程 序 通 过 U-SALT 
表 中 的 符 亏 地 址 直接 调用 内 核 例 程 时 ， 才 会 通过 特权 级 检查 。 

在 本 半 里 ， 内 核 也 做 同样 的 工作 。 不 同 之 处 在 于 ， 它 将 用 尸 程序 的 
特权 级 定 为 3， 也 束 是 最 低 的 特权 级 列 。 没 有 人 愿意 将 目 己 的 程序 放 在 特 
权 级 3 上 ， 但 系统 核心 一 定 会 将 它 放 在 特权 级 3 上 。 





尽管 保护 借 式 非常 复杂 ， 但 这 并 没有 加 重用 户 程序 〈 应 用 程序 ) 编 
写 者 (程序 员 ) 的 负担 ， 因 为 他 们 不 必 状 处 的 层 的 很 多 东西 ， 这 也 是 为 
什么 本 章 没 有 所 供用 户 程 序 代 人 码 清早 的 原因 。 事 实 上 ， 本 草 将 继续 沿用 
第 13 草 的 用 户 程序 ， 只 不 过 要 作为 一 个 任务 进行 加 载 ， 加 载 的 方法 和 上 
一 草 古 不 同 的 。 而 且 ， 运 行 时 的 特权 级 别 是 3， 不 再 是 上 一 章 中 的 0。 


为 了 方便 应 用 程序 的 编号， 内 核 通 种 要 提供 大 量 的 例 程 供 它们 调 
用 。 例 如 ， 在 第 13 章 中 ， 用 户 程 序 可 以 调用 内 核 例 程 @PrintString 和 
@ReadDiskData。 为 些 ， 用 户 程 序 需 要 定义 SALT 表 ， 并 在 表 中 圳 写 例 
程 的 符号 名 。 之 后 ， 再 由 和 内核 将 符号 名 转换 成 入 口 地 址 ， 也 吏 是 该 例 程 
所 对 应 的 段 选 择 子 和 上段 内 仿 移 量 。 


例 程 是 由 内 核 提供 的 ， 它 们 的 特权 级 通常 就 是 内 核 的 特权 级 。 在 上 
一 章 里 ， 内 核 程序 和 用 户 程序 都 运行 在 0 特权 级 ， 而 且 都 是 普通 的 段 间 控 
制 转移 ， 所 以 ， 在 用 户 程序 内 直接 调用 内 核 例 程 ， 这 不 会 有 任何 问题 。 


但 是 ， 考 处 一 下 ， 在 本 半 中 ， 用 户 程 序 运 行 时 的 特权 级 别 将 会 是 3。 
由 于 处 理 帝 茶 止 将 控制 从 特权 级 低 的 程序 转移 a 到 特权 级 融 的 程序 ， 因 
此 ， 如 琳 还 像 以 前 那样 直接 调用 内 核 例 程 ， 白 分 之 白 个 会 成 功 ， 一 定 会 
引 友 处 理 占 寞 当中 断 。 但 是， 现实 的 需求 也 不 能 不 耶 考 虑 ， 任 何 操作 系 
统 必 应当 提供 大 量 的 功能 调用 服务 。 为 此 ， 和 需要 安 竣 调用 1]。 

调用 门 (Call-Gate〉 用 于 在 不 同 特权 级 的 程序 之 间 进 行 控 制 转移 。 
本 质 上 ， 捷 只 是 一 个 手 述 待 ， 一 个 不 同 于 代码 段 和 数据 段 的 摘 述 符 ， 可 
以 安 寂 在 GDT 或 者 LDT 中 。 该 搬 述 从 的 格式 如 图 14-9 所 示 ， 下 面 是 低 
32 位 ， 上 和 面 是 局 32 位 。 


31] 1l6 15 14 13 12 11 8 7 6 5 4 0 


TYPE 
段 内 偏 移 量 31 一 16 DPL | 0 me 
回回 加 站 





31 16 15 0 
图 14-9 调用 门 持 述 符 的 格式 


如 图 15-9 所 示 ， 调 用 门 招 述 符 给 出 了 例 程 所 在 代码 段 的 选 挤 于， 而 
个 是 32 位 线性 地 址 。 有 了 段 选 择 子 ， 束 能 访问 拍 述 从 表 得 到 代码 段 的 基 


地 址 ， 这 样 做 无 非 征 间接 了 一 点 ， 但 却 可 以 在 通过 调用 门 进行 控制 转移 
时 ， 实 施 代码 段 搞 述 符 有 效 性 、 段 界限 和 特权 级 的 检查 。 


例 程 在 代 人 码 段 中 的 仿 移 量 也 古 在 拍 述 从 中 年 接 指 定 的 ， 只 是 被 分 成 
了 两 个 16 位 的 部 分 。 很 显然 ， 在 通过 调用 门 调 用 例 程 时 ， 不 使 用 指令 中 
给 出 的 仿 移 量 。 


摘 述 符 中 的 TYPE 字段 用 于 标识 门 的 类 型 ， 共 4 比特 ， 值 “1100" 表 示 
调用 门 。 

拍 述 符 中 的 P 位 是 有 效 位 ， 通 币 应 该 是 们 。 当 它 为 "0" 时 ， 调 用 这 样 
的 门 会 寻 致 处 理 器 产生 措 帝 中 断 。 对 于 操作 系统 来 说 ， 这 个 机 关 可 能 会 
很 有 有 用。 比如， 为 了 统计 调用 门 的 使 用 频率 ， 可 以 将 它 置 "0"。 然 后 ， 
当 因 调用 诅 门 而 产生 弄 第 中 断 时 ， 在 中 断 处 理 程序 中 将 该 门 的 调用 次 数 
加 一 ， 同 时 把 P 位置" 人。 对 于 因 P 位 为 "0" 而 引起 的 中 断 来 说 ， 它 们 属于 
故障 中 断 ， 从 中 新 处 理 过 程 返 回 时 ， 处 理 套 还 会 重新 执行 引起 故障 的 指 
令 。 此 时 ， 因 P 已 经 为 4*， 所 以 可 以 执行 。 束 当前 的 例子 而 言 ， 因 为 在 
所 供 调 用 门 服务 的 同时 ， 还 要 统计 门 的 调用 次 数 ， 改 ， 可 以 在 该 调用 门 ] 
所 对 应 的 例 程 中 将 P 位 清 零 。 这 样 ， 下 一 次 该 门 被 调 用 时 ， 叉 会 重复 以 
上 过 程 。 

通过 调用 门 实 施 特权 级 之 则 的 控制 转移 时 ， 可 以 使 用 jmp far 指令 ， 
也 可 以 使 用 call far 指令 。 如 果 是 后 者 ， 会 改变 当前 特权 级 CPL。 因 为 栈 
段 的 特权 级 必须 同 当 前 特权 级 你 持 一 致 ， 因 此 ， 还 要 切换 栈 ， 即 ， 从 低 
特权 级 的 栈 切 换 到 高 特权 级 的 栈 。 比 如 ， 一 个 特权 级 为 3 的 程序 必须 使 用 
目 己 的 3 特权 级 栈 工作 。 妆 它 退 过 调用 门 进 入 0 特权 级 的 代 人 码 段 执行 时 ， 
当前 特权 级 由 3 变 为 0。 此 时 ， 栈 也 要 跟 看 切换 ， 从 3 特权 级 的 栈 切 换 到 0 
特权 级 的 栈 。 这 主要 是 为 了 防止 因 栈 空间 不 足 而 产生 不 可 预料 的 问题 ， 
同时 也 是 为 了 防止 栈 数据 的 交叉 引用 。 


为 了 切换 栈 ， 每 个 任务 除了 目 己 固有 的 栈 之 外 ， 还 必须 额外 定义 几 
套 栈 ， 具 体 数 量 取决 于 任务 的 特权 级 别 。0 特权 级 任务 不 需要 窜 外 的 栈 ， 
它 目 己 固有 的 栈 束 在 够 使 用 ， 因 为 除了 调用 返回 外 ， 人 不可 能 将 控制 转移 
到 低 特权 级 的 段 ; 1 特权 级 的 任务 需要 额外 定义 一 个 描述 符 特 权 级 DPL 
为 0 的 栈 ， 以 便 将 控制 转移 到 0 特权 级 时 便 用 ; 2 特权 级 的 任务 则 需要 牢 
外 定义 两 个 栈 ， 擅 述 符 特权 级 DPL 分 别 是 0 和 1， 在 控制 转移 到 0 特权 级 
和 1 特权 级 时 使 用 ; 3 特权 级 的 任务 最 多 额外 定义 3 个 栈 ， 摘 述 符 特权 级 
分 别 征 0、1 和 2， 在 控制 转移 到 0、1 和 2 特权 级 时 使 用 。 


不 要 担心 ， 这 些 额外 的 栈 ， 也 会 由 操作 系统 加 载 程序 时 目 动 创 建 ， 
本 章 的 源 代码 就 演示 了 这 一 过 程 。 想 想 看 ， 如 果 这 一 切 都 由 你 来 做 ， 你 
一 定 不 会 把 目 己 程序 的 特权 级 别 定 得 很 低 ， 以 致 于 还 要 切换 栈 段 ， 对 不 
对 ? 


这 些 额 外 创建 的 栈 ， 其 描述 符 位 于 任务 目 己 的 LDT 中 。 同 时 ， 还 要 
在 任务 的 TSS 中 登记 ， 原 因 是 ， 栈 切换 是 由 人 处理 占 固件 自动 完成 的 ， 处 
理 右 需要 根据 TSS 中 的 信息 来 完成 这 一 过 程 。 如 图 14-2 所 示 ， 在 TSS 
内 ， 从 偏 移 4 一 24 处 登记 有 特权 级 0 到 2 的 栈 段 选择 子 ， 以 及 相应 的 ESP 
初始 值 。 任 务 目 己 国有 的 栈 信 息 则 位 于 偏 移 量 为 56 (ESP) 和 80 (SS) 
的 地 方 。 


任务 寄存 如 TR 总 是 指 癌 当前 任务 的 任务 状态 段 TSS， 其 内 容 为 该 
TSS 的 基地 址 和 界限 。 在 切换 栈 时 ， 处 理 如 可 以 用 TR 找到 当前 任务 的 
TSS， 并 从 TSS 中 获取 新 栈 的 信息 。 


通过 调用 门 使 用 高 特权 级 的 例 程 服 务 时 ， 调 用 者 会 传 饮 一 些 参 效 给 
例 程 。 如 条 是 通过 寄存 和 传 大， 这 没有 什么 可 说 的 。 不 过 ， 要 传递 的 参 
数 很 多 时 ， 更 经 党 的 做 法 是 通过 栈 进 行 。 调 用 者 把 参数 压 入 栈 ， 例 程 从 
栈 中 取出 参数 。 在 局 级 语言 里 ， 这 古 一 员 的 做 法 。 


例 程 需要 什么 参数 ， 先 压 入 哪个 参数 ， 后 压 入 哪个 参数 ， 这 征调 用 
者 和 例 程 之 间 的 约定 ， 调 用 者 是 消 楚 的 。 人 耕 则 ， 它 不 会 调用 这 个 例 程 。 
但 是 ， 这 一 切 对 于 处 理 带 来 说 是 懂 全 的 。 特 别 是 ， 当 栈 切 换 时 ， 参 数 还 
在 旧 栈 中 。 为 了 使 例 程 能 获得 参数 ， 必 须 将 参数 从 旧 栈 复制 到 新 栈 中 。 


参数 的 复制 工作 是 由 处 理 胡 回 件 完成 的 ， 但 它 必须 事先 知道 参数 的 
个 数 ， 并 根据 该 数量 决定 复制 多 少 内 容 。 所 以 ， 调 用 门 质 述 符 中 还 有 一 
个 参数 个 数字 段 ， 共 5 比特 。 残 是 说 ， 至 多 允许 传送 31 个 参数 。 

栈 切 换 前 ， 段 寄存 仑 SS 指 癌 的 古旧 栈 ，ESP 指 疝 旧 栈 的 栈 项 ， 即 
最 后 一 个 被 压 入 的 过 程 参 数 ， 栈 切换 后 ， 处 理 帮 目 动 亚 换 SS 和 ESP 寄 
存 帮 的 内 容 ， 使 它们 分 别 为 新 栈 的 选择 子 和 新 栈 的 栈 项 (最 后 一 个 被 复 
制 的 参数 ) 。 这 一 切 ， 对 程序 的 编 与 者 来 说 是 透明 的 。 所 请" 透明 "， 驶 是 
说 ， 程 序 员 不 用 关心 栈 的 切换 和 参数 的 复制 ， 他 即使 不 知 中 还 有 栈 切 换 
这 回 事 ， 也 不 会 影响 程序 编写 工作 。 因 为 ， 在 栈 切 换 前 ， 


pop edx 


可 以 得 到 最 后 一 个 被 压 入 的 参数 ， 在 栈 切 换 后 ， 这 条 指令 同样 可 以 
得 到 那个 参数 ， 尽 官 栈 段 和 栈 顶 指针 已 经 改变 。 


调用 门 描述 符 中 的 DPL 和 目标 代码 段 描述 符 的 DPL 用 于 决定 哪些 特 
权 级 的 程序 可 以 访问 此 门 。 有 具体 的 规则 是 必须 同时 符合 以 下 两 个 条 件 才 
行 : 

e 当 前 特权 级 CPL 和 请 求 特 权 级 RPL 高 于 ， 或 者 和 调用 门 描述 符 特 
权 级 DPL 相同 。 即 ， 在 数值 上 


CPIL 科 调用 门 描述 符 的 DPL 
RPI 科 调用 门 摘 述 符 的 DPL 


e 当前 特权 级 CPL 低 于 ， 或 者 和 目标 代码 段 描述 符 特 权 级 DPL 相 
同 。 即 ， 在 数值 上 


CPL 写 目标 代码 段 描 述 符 的 DPL 


举 个 例子 ， 如 果 调 用 门 描述 符 的 DPL 为 2， 那 么 ， 只 有 特权 级 为 0、 
1 和 2 的 程序 才 人 允许 使 用 该 调用 门 ， 特 权 级 为 3 的 程序 使 用 此 门将 引发 处 
理 硕 异常 中 靳 。 


如 图 14-10 所 示 ， 调 用 门 的 DPL 是 特权 级 检查 的 下 限 。 除 此 之 外 ， 
目标 代码 段 的 特权 级 也 是 需要 考虑 的 因素 。 调 用 门 摘 述 符 中 有 目标 代码 
段 的 选择 子 ， 它 指 同 目标 代码 段 的 描述 符 。 当 一 个 程序 通过 调用 门 转移 
控制 时 ， 处 理 喜 还 要 检查 目标 代码 段 描述 符 的 DPL， 访 DPL 决定 了 调用 
门 特权 级 检查 的 上 限 。 也 融 是 说 ， 只 有 那些 特权 级 低 于 或 者 等 于 目标 代 
公 段 DPL 的 程序 才 人 允许 使 用 此 门 。 


调用 门 挡 述 符 中 有 一 些 字段 没有 使 用 ， 固 定 为 "0"”。 


调用 门 CALL GATE 


目标 代码 段 描述 符 的 DPL 
可 


-一 
a 
(2 


调用 者 的 CPL 和 RPL 
四 
调用 门 描述 符 的 DPL 





图 14-10 调用 门 的 基本 特权 级 检查 规则 
14.3.2 ”调用 门 的 安装 和 测试 


第 812 一 826 行 用 于 安装 调用 门 的 描述 符 ， 其 实 也 就 等 于 是 在 安装 调 
用 门 。 

安装 的 调用 门 供 其 他 特权 级 的 程序 使 用 ， 它 们 在 本 质 上 是 一 些 例 
程 ， 这 些 例 程 在 上 一 章 里 使 用 过 ， 相 信 都 不 会 陌生 。 在 上 一 章 里 ， 所 有 
对 外 公开 的 例 程 都 以 字符 串 的 形式 定义 在 SALT 表 中 ， 该 表 位 于 内 核 数 据 
段 。 

内 核 数 据 段 中 的 SALT 表 简 称 C-SALT， 位 于 代码 清单 14-1 的 第 364 
一 383 行 ， 属 于 内 核 数 据 段 。 该 表 由 多 个 条 上 日 组 成 ， 每 个 条 日 262 字 
节 ， 其 中 ， 前 256 字 节 是 例 程 的 名 字 ， 后 6 字 节 是 例 程 的 地 址 (前 4 字 节 
是 例 程 在 目标 代码 段 内 的 偏 移 量 ， 后 2 字 节 是 例 程 所 在 代码 段 的 选择 
了 

所 有 例 程 都 位 于 公共 例 程 段 中 ， 而 公共 例 程 段 的 DPL 是 0。 为 了 使 其 
他 特权 级 的 程序 也 能 使 用 这 些 例 程 ， 必 须 将 C-SALT 表 中 的 例 程 地 址 转换 
成 调用 门 。 


转换 过 程 使 用 了 循环 。 转 换 时 需要 定位 每 一 个 条 目 ， 故 ， 第 812 行 
用 于 将 C-SALT 表 的 起 始 偏 移 地 址 传送 到 EDI 寄存 器 ， 这 是 第 一 个 条 目的 
位 置 ， 以 后 每 次 加 上 262， 就 能 对 准 下 一 个 条 目 。 

循环 次 数 是 由 条 上 日 数量 控制 的 ， 条 日数 是 和 常数 salt items， 位 于 第 
386 行 ， 第 813 行 的 指令 用 于 将 它 作 为 立即 数 传 送 到 ECX 寄存 器 。 

循环 的 结构 是 这 样 的 : 


814 3 
815 push ecx 


;这 里 是 具体 执行 转换 的 指令 


824 add edi,salt item len : 指 回 下 一 个 C-SALT 条 目 
8295 pop ecx 
826 【DCp .D3 


因为 在 转换 过 程 中 要 用 到 ECX 寄存 磺 ， 所 以 在 每 次 循环 的 一 开始 ， 
要 先 压 栈 保存 ECX 寄 人 存货 的 值 ， 然 后 ， 在 loop 指令 执行 前 恢复 。 


在 循环 体内 ， 第 816 行 ， 用 于 将 每 个 条 目 《〈 例 程 ) 的 32 位 段 内 仿 移 
地 址 传送 到 EAX 寄存 苍 。 每 个 条 目的 长 度 是 262 字 市 ， 而 它 的 偏 移 地 址 
则 位 于 256 字 节 处 。 第 817 行 ， 用 于 获取 条 目 《 例 程 ) 所 在 代码 段 的 选 
择 子 ， 它 位 于 条 目 内 第 260 字 市 处 。 


创建 调用 门 描述 符 的 工作 实际 上 是 调用 过 程 make_gate_descriptor 
来 完成 的 。 该 过程 位 于 第 331 行 ， 属 于 公共 例 程 段 。 调 用 该 过 程 时 ， 需 
要 传 入 三 个 参数 ， 分 别 是 EAX 寄存 融 中 的 32 位 偏 移 地 址 、BX 寄 和 存货 中 
的 代码 段 选择 子 ， 以 及 CX 寄存 器 中 的 门 属性 。 调 用 门 的 属性 字段 是 2 字 
节 的 长 度 ， 通 过 CX 寄存 震 传 入 门 属 性 时 ， 必 须 保 证 各 属性 位 都 在 原始 位 
置 。 在 我 们 的 代码 中 ， 每 次 通过 CX 寄存 需 传 入 的 值 是 


818 mov cx,1 11 0 1100 000 00000B 


很 显然 ，P 二 1，DPL 二 3， 即 ， 只 有 特权 级 局 于 等 于 3 的 代码 段 才能 
调用 此 门 ， 参 数 的 数量 为 0， 也 就 是 不 需要 通过 栈 传递 参数 。 


下 面 我 们 来 看 一 看 例 程 nake gate _ descriptor 都 做 了 些 什 么 。 


第 340 一 342 行 ， 先 在 EDX 寄存 器 中 得 到 32 位 偏 移 地 址 的 复制 品 ， 
然后 将 低 16 位 清除 ， 只 留 下 32 位 偏 移 地 址 的 高 16 位 部 分 ， 并 同 CX 寄存 
器 中 的 属性 值 一 起 ， 形 成 调用 门 描 述 符 的 高 32 位 。 

第 344 一 346 行 ， 将 EAX 寄存 需 的 高 16 位 清除 ， 只 留 下 32 位 偏 移 地 
址 的 低 16 位 。 接 着 ， 将 EBX 寄存 器 逻辑 左 移 16 次 ， 使 得 段 选择 子 位 于 
它 的 高 16 位 。 最 后 ， 用 or 指令 将 这 两 个 寄存 器 合并 ， 束 得 到 了 调用 门 摘 
述 符 的 低 32 位 。 

第 351 行 ，retf 指令 使 得 控制 返回 调用 者 。 注 意 ， 从 这 条 指令 可 以 看 
出 ， 该 过程 必须 以 远 调 用 的 方式 使 用 。 

回 到 内 核 代码 段 。 

第 821 、822 行 ， 在 调用 了 例 程 make _ gate _descriptor 后 ， 立即 调 
用 了 另 一 个 例 程 set up _ gdt descriptor 来 安装 刚才 创建 的 调用 门 描述 
人 符 。 在 GDT 中 安装 描述 符 的 过 程 和 前 一 章 相 同 ， 不 再 讲述 。 显 然 ， 调 用 
门 摘 述 符 是 在 GDT 中 创建 的 ， 并 用 CX 寄存 器 返回 访 摘 述 符 的 选择 子 ， 
即 调用 门 选 择 子 。 

第 823 行 ， 将 返回 的 调用 门 选 择 子 回 填 到 条 目 内 ， 用 以 窗 新 原先 的 
代码 段 选 择 子 。 

取决 于 C-SALT 表 的 大 小 ， 循 环 过 程 会 进行 多 次 。 在 本 章 中 ，C- 
SALT 表 中 共有 4 个 条 目 ， 这 4 个 调用 门 安装 之 后 ，GDT 的 布局 如 图 14- 
11 所 示 。 


第 829、830 行 对 刚 安 闻 好 的 调用 门 进行 测试 ， 看 它 好 不 好 用 。 训 试 
的 结束 是 在 屏 攻 上 显示 一 行文 字 ， 意 思 为 "系统 范围 内 的 调用 门 已 经 安 
直上 


A o 

标号 salt_1 指 同 C-SALT 表 中 第 一 个 条 目的 起 始 处 ， 在 此 基础 上 增加 
256， 束 是 它 的 地 址 部 分 。 现 在 我 们 已 经 知道 ， 访 条目 对 应 着 公共 例 程 段 
中 的 put_string 过 程 ， 用 于 显示 零 终 止 的 字符 串 。 

表面 上 ， 这 是 一 条 普通 的 间接 绝对 远 调 用 指令 call far， 通 过 指令 中 
给 出 的 地 址 操作 数 ， 可 以 间接 取得 32 位 的 偏 移 地 址 和 16 位 的 代码 段 选 择 
子 ， 这 样 的 指令 我 们 太 熟 悉 了 。 但 是 ， 处 理 器 在 执行 这 条 指令 时 ， 会 用 
该 选择 子 访问 GDTLDT， 检 奏 那 个 选择 子 ， 看 它 指 回 的 是 调用 门 摘 述 
符 ， 还 是 普通 的 代码 段 描述 符 。 如 果 是 前 者 ， 束 按 调 用 门 来 处 理 ; 如 果 
是 后 者 ， 还 按 一 般 的 段 间 控制 转移 处 理 。 


在 这 里 ， 因 为 salt_1 条 目的 选择 子 已 经 被 奏 换 成 调用 门 选择 子 ， 所 
以 处 理 右 按 调 用 门 的 方式 来 执行 控制 转移 。 通 过 调用 门 实 施 控制 转移 
时 ， 处 理 器 只 用 选择 子 部 分 ，salt_1 条 目 中 给 出 的 32 位 偏 移 量 部 分 被 丢 
茎 。 原 因 很 简单 ， 通 过 调用 门 进行 控制 园 移 不 需要 侦 移 量 ， 偶 移 量 已 经 
在 调用 门 拍 述 从 中 给 出 了 。 不 单单 是 则 接 绝对 远 调用 ， 和 直接 绝对 远 调 用 
也 是 这 样 ， 如 末 选 择 子 指 加 的 是 调用 门 ， 俩 移 量 也 会 被 急 略 ， 例 如 : 


call Ox0040:0x0000c000 
在 这 个 例子 中 ， 因 为 是 通过 调用 门 实施 控制 转 黎 ， 处 理 融 将 忽略 偏 
移 量 0x0000c000。 
SDT 户 偶 入 描述 符 索引 号 
调用 门 〈《@TerminateProgram，DPL 王 3) 58 
调用 门 〈@PrintDwordAsHexString，DPL 王 3 ) 50 
调用 门 〈@ReadDiskData，DPL 王 3) 48 


调用 门 〈Q@RrintString，DPL 三 3) 40 


十 38 核心 代码 段 〈 位 置 和 长 度 不 定 ，DPL 一 0) 38 

+30 核心 数据 段位 置 和 长 度 不 定 ，DPL==0) a 

.78 公用 例 程 段 〈00040000 一 长 度 不 定 ，DPL=0) 28 
日 9 = 


oe 初始 栈 段 〈00006C00 一 00007C00，DPL =0 ) 18 

Pe 初始 代码 段 〈00007C00 一 00007DFF，DPL =0) 10 

Pe 0 一 4GB 数 据 段 (00000000 一 FFFFFFFF，DPL=0) 08 
8 


空 描述 符 00 


4120 文本 模式 显存 (000B8000 一 000BFFFF，DPL = 三 0) 20 





图 14-11 安 竣 调用 门 后 的 GDT 布局 


信 助 调用 门 ， 当 程序 的 执行 滨 从 低 特权 级 的 代 人 码 段 转 入 融 特 权 级 的 
代码 段 时 ， 如 果 那 是 个 非 依从 的 代码 段 ， 当 前 特权 级 也 随 之 变 为 目标 代 


码 段 的 特权 级 。 不 过 ， 如 果 调 用 者 和 被 调用 者 的 特权 级 相同 ， 则 特权 级 
不 会 变化 。 在 当前 的 例子 中 ， 是 从 内 核 代 但 段 调 用 公共 例 程 段 的 例 程 ， 
尽管 也 是 通过 调用 门 ， 但 它们 的 特权 级 都 是 0。 所 以 ， 在 控制 转移 的 过 程 
中 不 会 发 生 栈 切换 ， 仅 仅 是 把 返回 地 址 CS 和 EIP 压 入 当前 栈 。 当 执行 
retf 指令 后 ， 处 理 器 从 栈 中 恢复 CS 和 EIP 的 原始 内 容 ， 于 是 又 返回 到 原 
先 的 代码 段 挝 看 执行 。 


事实 上 ， 能 够 通过 调用 门 发 起 控制 转移 的 指令 还 包括 imp， 但 只 用 在 
不 需要 从 调用 门 返回 的 场合 下 ， 而 且 不 改变 当前 特权 级 。 也 就 是 说 ， 目 
标 代 码 是 在 当前 特权 级 上 执行 。 

通过 调用 门 进行 控制 转移 的 特权 级 检查 ， 既 要 在 转移 前 进行 ， 而 
且 ， 还 要 在 控制 返回 时 进行 。 完 整 的 特权 级 检查 过 程 将 在 本 章 的 后 面 进 
一 步 说 明 。 

检测 点 14.2 

1. 通过 调用 门 转移 控制 时 ，CPL、RPL 和 目标 代码 段 描述 符 的 


DPL 必须 在 数值 上 符合 的 条 件 ，CPL 、RPL 和 调用 门 
描述 符 的 DPL 必须 在 数值 上 符合 的 条 件 。 即 ， 只 能 通过 


调用 门将 控制 转移 到 与 当前 特权 级 相同 或 者 更 高 的 代码 段 。 
2. 调用 门 描述 符 只 能 安装 在 GDT 中 吗 ? 如 果 某 调用 门 描述 符 的 值 
是 0x0000CC0000552FC0， 那 么 ， 目 标 代码 段 的 选择 子 是 ， 段 内 
偏 移 量 为 ， 摘 述 符 的 特权 级 是 ， 目 标 代 码 段 的 特权 级 是 
， 要 通过 此 门 转移 控制 ，CPL 和 RPL 要 符合 什么 条 件 才 行 ? 








14.4 加载 用 户 程序 并 创建 任务 
14.4.1 任务 控制 块 和 TCB 链 


继续 讲解 代 但 清单 14-1。 


第 832、833 行 是 以 传统 的 方式 调用 内 核 例 程 显示 字符 串 。 即 使 不 通 
过 调用 门 ， 特 权 检 查 也 是 照 利 进行 的 ， 而 且 更 为 严格 。 把 控制 从 较 低 的 
特权 级 转移 到 较 局 的 特权 级 ， 通 过 调用 门 肖 有 可 能 ， 但 直接 控制 转移 则 
在 任何 时 候 都 是 不 允许 的 。 当 然 ， 在 这 里 ， 是 从 0 特权 级 的 内 核 代 公 段 进 
入 同样 是 0 特权 级 的 公共 例 程 段 ， 能 够 通过 特权 级 检查 。 


在 内 核 初始 化 完成 后 ， 和 第 13 章 一 样 ， 接 下 来 的 工作 就 是 加 载 和 重 
定位 用 户 程序 〈 应 用 程序 ) ， 并 移交 控制 权 。 按 处 理 器 的 要 求 标准 ， 要 
使 一 个 程序 成 为 "任务 "， 并 且 能 够 参与 任务 切换 和 调度 ， 那 不 是 简 简单 音 
就 能 行 的 ， 必 须要 有 LDT 和 TSS。 而 为 了 创建 这 两 样 东西 ， 又 需要 更 多 
的 东西 。 所 以 ， 加 载 和 执行 用 户 程序 的 活 儿 ， 比 起 从 前 是 麻烦 了 不 少 。 
不 信 ? 一 会 儿 就 要 做 这 件 事 ， 到 时 候 你 就 知道 了 。 

加 载 程序 并 创建 一 个 任务 ， 需 要 用 到 很 多 数据 ， 比 如 程序 的 大 小 、 
加 载 的 位 置 ， 等 等 。 当 任务 执行 结束 ， 还 要 依据 这 些 信息 来 回收 它 所 占 
用 的 内 存 空间 (在 本 书 中 没有 体现 ， 但 一 个 合格 的 操作 系统 必须 实现 该 
功能 ) 。 还 有 ， 多 任务 系统 是 多 个 任务 同时 运行 的 ， 特 别 是 在 一 个 单 处 
理 器 ( 核 ) 的 系统 中 ， 为 了 在 任务 之 间 切 换 和 轮转 ， 必 须 能 追踪 到 所 有 
正在 运行 的 任务 ， 记 录 它 们 的 状态 ， 或 者 根据 它们 的 当前 状态 来 采取 适 
当 的 操作 (在 本 书 的 第 16 章 ， 将 学 习 任务 的 切换 和 轮转 技术 ) 。 


为 了 满足 以 上 的 要 求 ， 内 核 应当 为 每 一 个 任务 创建 一 个 内 存 区 域 ， 
来 记录 任务 的 信息 和 状态 ， 称 为 任务 控制 块 (Task Control Block ， 
TCB) 。 任 务 控制 块 不 是 处 理 喜 的 要 求 ， 是 我 们 目 己 为 了 方便 而 发 明 
的 。 如 图 14-12 所 示 ， 这 是 任务 控制 块 的 结构 ， 很 明显 ， 这 里 有 两 种 大 小 
的 方 格 ， 较 罕 的 格子 代表 16 位 的 数据 宽度 ， 即 1 个 字 ; 而 较 宽 的 格式 代 
表 32 位 的 数据 宽度 ， 即 2 个 字 。 注 意 ， 不 要 纠结 于 表 中 的 内 容 和 细节 ， 
有 个 大 概 印象 即 可 。 


十 0X46 一 全 上 9 为 了 能 够 人 奶 踪 到 所 有 任务 ， My 

xygN#7 | 当 把 每 个 任务 控制 块 TCB 串 起 来 ， 
?特权 级 楼 的 初始 ESP 形成 一 个 链表 (链表 是 一 种 数据 结 

一 ”| 构 ， 有 一 门 计算 机 课程 就 叫做 《 数 


?特权 级 栈 基地 址 据 结 构 》) 。 


十 0x3A 一 > 代 人 清单 14-1 的 第 414 行 ， 声 


FO 明了 标号 tcb_chain 并 初始 化 为 一 个 
sp | 双 字 初始 的 数值 为 零 。 实 际 上 ， 


十 0x44 一 盖 





十 0x40 一 二 
0x3E 一 伪 


[特权 级 杭 造 # | 它 是 一 个 指针 ， 用 来 指向 第 一 个 任 
二 0x2C —> 时 ， 表 示 任 务 的 数量 为 0， 也 束 是 没 


oo 。 | 有 任务 。 在 创建 了 第 一 个 任务 后 ， 
十 0x28 一 > 

hs | 性 汪 把 该 任务 的 TCB 线性 基地 址 填 
十 0x24 一 > 与 到 这 里 。 


Pe 0 特权 级 栈 选择 子 


站 


十 0x1E 一 二 

0 特权 级 栈 以 4KB 为 单位 的 长 度 一 个 任务 的 TCB 。 如 果 该 位 置 是 
十 Ox i 二 sa 员 
Te |] 零 ， 表 示 后 面 没有 任务 ， 这 是 链 上 


”ss 的 最 后 “个 任务 ， 侍 则 ， 它 的 数值 

TO 一 窟 一 一 一 | 半 必 下 一 个 任务 的 TCB 线 性 基地 

1 pr | 址 。 如 图 14-13 所 示 ， 所 有 任务 都 按 
| | 

HC _ 一 tcb_chain 开始 ， 可 以 依次 找到 每 


= 
程序 加 载 基 地 址 
十 0x06 一 > 


i 


下 一 个 TCB 基 地 
十 0x00 一 二 


图 14-12 ”任务 控制 块 TCB 的 结构 


tcb_chaln 


tcb 







下 一 个 TCB 基 地 址 
| 下 一 个 TCB 基 地 址 






任务 控制 信息 


任务 控制 信息 


图 14-13 ”任务 控制 块 链 


第 836 一 838 行 ， 用 于 分 配 创建 TCB 所 需要 的 内 存 空间 ， 并 将 其 挂 
在 TCB 链 上 。 如 图 14-12 所 示 ， 当 前 版 本 的 TCB 结构 需要 0x46 字 节 的 内 
存 空间 。 

将 新 TCB 奶 加 到 链表 上 的 工作 是 由 过 程 append_to_tcb_link 来 完成 
的 ， 位 于 代码 清单 14-1 的 第 735 一 772 行 ， 属 于 内 核 代 码 段 的 内 部 

( 近 ) 过 程 ， 图 14-14 是 它 的 整个 流程 图 。 

过 程 append to tcb link 的 工作 思路 是 遍历 整个 链表 ， 找 到 最 后 一 
个 TCB， 在 它 的 TCB 指针 域 里 填写 新 TCB 的 首 地 址 。 它 需要 用 ECX 作 
为 传 入 的 参数 ，ECX 的 内 容 应 当 为 新 TCB 的 线性 地 址 。 


这 里 有 一 个 小 小 的 麻烦 。 链 首 指针 tcb_chain 是 在 内 核 数 据 段 声明 并 
初始 化 的 ， 只 能 知道 它 在 段 内 的 俩 移 ， 而 不 知道 它 的 线性 地 址 ， 因 此 ， 
只 能 通过 内 核 数据 段 访 问 ， 而 无 法 通过 线性 地 址 来 访问 : 相反 地 ， 链 上 
的 每 个 TCB， 其 空间 都 是 动态 分 配 的 ， 只 能 通过 线性 地 址 来 访问 。 

因此 ， 在 将 两 个 段 寄 存 器 和 两 个 通用 寄存 器 压 栈 保护 之 后 ， 第 742 一 
745 行 ， 我 们 令 段 寄存 右 DS 指 问 内 核 数据 段 以 读 写 链 首 指针 
tcb_chain， 而 ES 指 癌 整个 4GB 内 存 空 间 ， 用 于 过 历 和 访问 每 一 个 
TCB。 


第 747 行 ， 要 追加 的 TCB 一 定 是 链表 上 最 后 一 个 TCB， 故 其 用 于 指 
品 下 一 个 TCB 的 指针 域 必 须 清 零 ， 以 表明 自己 是 链 上 最 后 一 个 TCB。 
个 TCB 的 空间 都 是 动态 分 配 的 ， 其 首 地 址 都 是 线性 地 址 ， 只 能 用 由 段 寄 
存 器 ES 所 指 癌 的 4GB 段 来 访问 。 


第 750 一 752 行 ， 观 察 链 首 指针 tcb_chain 是 否 为 零 。 知 为 零 ， 则 表 
明 整 个 链表 为 空 ， 直 接 转 移 到 第 763 行 的 标号 :notcb 处 ， 在 那里 ， 直 接 


将 链 首 指针 指 同 新 的 TCB， 恢 复 现 场 后 直接 返回 调用 者 。 


第 754 一 758 行 ， 知 链 首 指针 不 为 零 ， 表 明 链 表 非 空 ， 需 要 顺 着 整个 
链 找到 最 后 一 个 TCB。 和 链 首 指针 tcb_chain 不 同 ， 每 个 TCB 需要 用 4GB 


的 段 来 访问 ， 即 使 用 段 寄 存 右 ES 。 


月 
是 〈.notcb ) 链表 为 空头 指针 为 0) ? 


合 〈. searc) 


顺 着 TCB 链 找到 最 后 一 个 TCB 







令 头 指针 指向 当前 
TCB 


令 最 后 一 个 TCB 的 指针 域 指 向 当前 
TCB 


.TetpcC 


恢复 现场 并 返回 


图 14-14 ”向 TCB 链 上 追加 任务 控制 块 的 流程 图 


首先 ， 将 链表 中 要 访问 的 那个 TCB 的 线性 地 址 传送 到 EDX 寄存 器 ; 
然后 ， 访 问 它 的 TCB 指针 域 ， 看 它 是 否 为 零 。 如 果 不 为 零 ， 表 明 它 不 是 
链 中 最 后 一 个 TCB， 后 面 还 有 其 他 TCB， 于 是 将 控制 转移 到 .searc， 令 
EDX 寄存 右 指 同 下 一 个 TCB， 继 续 搜 寻 。 

若 为 零 ， 表 明 它 就 是 链 上 最 后 一 个 TCB， 第 760 行 ， 用 ECX 的 内 容 
填写 其 TCB 指针 域 ， 让 它 指 向 新 的 TCB。 完 成 后 ， 第 761 行 ， 直 接 转 移 


到 标号 .retpc 处 ， 恢 复 现 场 并 返回 调用 者 。 
14.4.2 ”使 用 栈 传递 过 程 参 数 


下 面 的 工作 是 加 载 和 重 定 位 用 户 程 序 ， 依 然 是 在 过 程 
load_relocate_program 中 进行 。 访 过程 需要 传 入 两 个 参数 ， 分 别 是 用 户 
程序 的 起 始 逻 辑 局 区 号 ， 以 及 它 的 任务 控制 块 TCB 线性 地 址 。 和 上 一 章 
不 同 的 是 ， 参 数 不 是 用 寄存 占 传 入 的 ， 而 是 采用 栈 。 事 实 上 ， 这 是 更 为 
流行 和 标准 的 做 法 。 原 因 很 徐 单 ， 寄 存 厚 数量 有 限 ， 襄 且 还 要 在 过 程 内 
部 使 用 ， 当 传 入 的 参数 很 多 时 ， 栈 是 最 好 的 选择 。 

第 840 一 843 行 ， 先 以 双 字 的 长 度 将 立即 数 50 压 入 当前 栈 ， 这 是 用 
户 程 序 的 起 始 馆 辑 面 区 亏 。 在 第 10 章 里 ， 我 们 已 经 知道 push 指令 可 以 压 
入 立即 数 。 因 此 ， 在 这 里 ， 压 入 到 栈 中 的 内 容 将 是 双 字 0x00000032 (十 
进 制 数 50) 。 接 看 ， 再 压 入 当前 任务 控制 块 TCB 的 32 位 线性 地 址 。 基 
后 ， 进 入 过 程 load relocate_program 内 部 执行 。 该 过 程 位 于 第 464 行 ， 
征 《〈 当 前 ) 内 核 代 码 段 的 内 部 过 程 。 

第 468 一 473 行 ， 移 做 一 些 体 护 现场 的 工作 ， 人 然后 将 栈 指 针 和 寄存 夫 
ESP 的 内 容 复制 到 EBP 寄存 器 ， 以 访问 栈 中 的 参数 。 栈 的 访问 有 两 种 ， 
一 种 是 隐 式 的 ， 由 处 理 器 在 执行 诸如 push、pop、call、ret 等 指令 时 自动 
进行 。 隐 式 地 访问 栈 需 要 使 用 指令 指针 寄存 占 ESP。 为 一 种 访问 栈 的 方 
式 不 依赖 于 先进 后 出 机 制 ， 而 是 把 栈 看 成 是 一 般 的 数据 段 ， 和 直接 访问 其 
中 的 任何 内 容 。 在 这 种 方式 下 ， 需 要 使 用 栈 基 址 寄存 硕 EBP。 这 里 有 个 
例子 ， 比 如 ， 从 栈 中 读 取 一 个 双 字 ， 该 数据 在 栈 中 的 偏 移 量 是 由 EBP 寄 
存 项 指 问 的 : 

mov edx, [ebp] 

在 32 位 模式 下 ， 处 理 占 执行 这 条 指令 时 ， 用 上 段 奇 存 右 SS 摘 述 从 融 
速 缓存 器 中 的 32 位 基地 址 ， 加 上 EBP 寄存 器 提供 的 32 位 偏 移 量 ， 形 成 
32 位 线性 地 址 ， 访 问 内 存 取得 一 个 双 字 ， 传 送 到 EDX 寄存 器 。 很 显然 ， 
用 EBP 寄存 右 来 寻 址 时 ， 不 需要 使 用 上 段 超越 前 级 "SS:"， 因 为 EBP 寄存 器 
出 现在 指令 中 的 地 址 部 分 时 ， 默 认 使 用 段 寄 存 器 SS 。 

如 图 14-15 所 示 ， 这 是 用 ESP 寄存 磺 的 内 容 初始 化 EBP 后 ， 栈 的 状 


E+ 


高 学 低 字 





TCB 线 性 地 址 : EBP 十 11X4 
8 个 双 字 (通用 寄存 器 ) 
栈 推进 方 癌 


| | 


图 14-15 ”执行 mov ebp,esp 指令 后 的 栈 状 态 


当前 的 栈 顶 位 置 是 SS:EBP， 指 问 一 个 双 字 ， 是 段 寄存 器 ES 的 内 
容 ， 因 为 最 近 一 次 的 压 栈 操作 是 


push es 


在 32 位 模式 下 ， 访 问 栈 用 的 是 栈 指针 寄存 磺 ESP， 而 且 ， 每 次 栈 操 
作 的 默认 操作 数 大 小 是 双 字 。 处 理 需 在 执行 压 栈 指令 时 ， 如 果 发 现 指令 
的 操作 数 是 段 寄 存 器 (CS、SS、DS、ES、FS、GS) ， 那 么 ， 将 先 执 
行 一 个 内 部 的 零 扩 展 操 作 ， 将 段 寄 存 器 中 的 16 位 值 扩展 成 32 位 ， 融 16 
位 是 全 零 ， 然 后 再 执行 压 栈 操作 。 当 然 ， 出 栈 指令 pop 会 执行 相反 的 操 
作 ， 将 32 位 的 值 截 短 为 16 位 ， 并 传送 到 相应 的 段 寄 存 器 。 

相应 地 ，SS : EBP 十 4 的 位 置 是 段 寄 存 右 DS 的 压 栈 值 。 因 为 栈 是 回 
下 推进 的 ， 故 较 早 压 入 的 内 容 反 而 位 于 高 地 址 方向 ， 回 训 它 们 需要 增加 
EBP 的 值 。 


从 SS : EBP 十 8 的 位 置 开 始 ， 是 pushad 指令 压 入 的 8 个 双 字 ， 其 中 
就 包括 EBP 在 压 栈 时 的 原始 内 容 。 


再 往 上 ， 是 调用 者 的 返回 地 址 。 因 为 load_relocate program 是 一 个 
内 部 过 程 ， 是 用 32 位 相对 近 调 用 (第 843 行 ) 进入 的 ， 故 只 压 入 了 EIP 
的 内 容 ， 而 没有 压 入 段 寄 存 器 CS 的 内 容 。 

好 了 ， 现 在 终于 到 了 我 们 感 兴 趣 的 地 方 。 当 初 调 用 
load_relocate_program 过 程 的 时 候 ， 压 入 了 两 个 参数 ， 分 列 是 任务 控制 
块 TCB 的 线性 地 址 ， 以 及 用 户 程 序 的 起 始 届 区 号 。 从 图 15-15 中 可 以 看 
出 ，TCB 线性 地 址 是 栈 中 的 第 11 个 双 字 (从 0 开始 算 起 ) 。 也 正 是 因为 
如 此 ，TCB 线性 地 址 在 栈 中 的 位 置 是 SS : EBP 十 44。 


问 梓 的 道理 ， 用 户 程序 起 始 锡 辑 忆 区 气 在 栈 中 的 位 置 是 SS : EBP 十 
48。 记 好 这 两 个 数 的 位 置 ， 一 会 儿 我 们 融 要 多 次 从 栈 中 访问 它们 。 


14.4.3 加载 用 户 程 序 


当 用 户 程序 被 读 入 内 存 ， 并 处 于 运行 或 者 等 待 运行 的 状态 时 ， 就 视 
为 一 个 任务 。 任 务 有 自己 的 代码 段 和 数据 段 〈 包 括 栈 ) ， 这 些 段 必 须 通 
过 描述 符 来 引用 ， 而 这 些 描述 符 可 以 放 在 GDT 中 ， 也 可 以 放 在 任务 自己 
私有 的 LDT 中 ， 但 最 好 是 放 在 LDT 中 。GDT 用 于 存放 各 个 任务 公有 的 描 
述 符 ， 比 如 公共 的 数据 段 和 公共 例 程 。 

每 个 任务 都 允许 有 自己 的 LDT， 而 且 可 以 定义 在 任何 内 存 位 置 。 所 
以 ， 我 们 现在 要 做 三 件 事 : 

e 分 配 一 块 内 存 ， 作 为 LDT 来 用 ， 为 创建 用 户 程序 各 个 段 的 描述 符 做 
准备 ; 

e 将 LDT 的 大 小 和 起 始 线 性 地 址 登记 在 任务 控制 块 TCB 中 : 

e 分 配 内 存 并 加 载 用 户 程序 ， 并 将 它 的 大 小 和 起 始 线性 地 址 登记 到 
TCB 中 。 

第 475、476 行 ， 令 段 寄 存 器 ES 指 问 4GB 内 存 段 。 

第 478 行 ， 先 从 栈 中 取得 TCB 的 线性 首 地 址 。 注 意 ， 因 为 源 操作 数 
部 分 使 用 的 是 基 址 寄存 器 EBP， 故 该 指令 默认 使 用 段 寄存 器 SS 来 访问 内 
存 〈 栈 ) 。 


接 痢 ， 第 481 一 484 行 ， 申 请 分 配 160 字 节 的 内 存 空间 用 于 创建 
LDT， 并 登记 LDT 的 初始 界限 和 起 始 线性 地 址 到 TCB 中 。LDT 的 界限 也 
是 16 位 的 ， 只 允许 8192 个 描述 符 。 和 GDT 一样， 界限 值 是 表 的 总 字 节 
数 减 1， 因 为 我 们 刚 创 建 LDT， 忌 字 市 数 为 0， 所 以 ， 当 前 的 界限 值 应 当 
是 0xFFFF (0 减 去 1) 。 

我 们 的 用 户 程序 很 简单 ， 不 会 划分 为 太 多 的 段 ，160 字 市 的 空间 可 
以 安装 20 个 描述 符 ， 应 当 足 够 了 。 如 图 14-12 所 示 ，LDT 的 线性 起 始 地 
址 是 登记 在 TCB 内 偏 移 0x0C 处 ，LDT 的 界限 是 登记 在 TCB 内 偏 移 0x0A 
处 。TCB 当初 也 是 动态 分 配 的 ， 需 要 通过 段 寄 存 需 ES 指 同 的 4GB 上 段 来 
访问 。 

第 487 一 500 行 ， 先 将 用 户 程序 头 部 读 入 内 核 缓冲 区 中 ， 根 据 它 的 大 
小 决定 分 配 多 少 内 存 。 具 体 的 方法 和 策略 在 上 一 章 已 讲解 过 了 ， 唯 一 需 
要 说 明 的 是 ， 在 调用 过 程 sSys routine seg sel:read hard disk 0 之 
前 ， 用 户 程 序 的 起 始 逻 辑 忆 区 与 是 从 栈 中 取得 的 。 

第 502 一 504 行 ， 根 据 用 户 程 序 的 实际 大 小 申请 分 配 内 存 空间 ， 并 将 
线性 基地 址 和 用 户 程序 的 大 小 登记 到 TCB 中 (参考 图 14-12) 。 


一 旦 知道 了 用 户 程 序 的 总 大 小 ， 接 下 来 ， 第 506 一 519 行 的 工作 就 古 
加 载 整个 用 户 和 程序， 这 和 上 一 章 也 是 相同 的 。 唯 一 不 同 的 是 ， 第 515 
行 ， 从 栈 中 重新 取得 用 户 程序 的 起 始 逻辑 而 区 亏 。 


14.4.4 ”创建 局 部 描述 符 表 


用 户 程序 已 极 加 载 到 内 存 中 ， 现 在 该 是 在 LDT 中 创建 段 插 述 答 的 时 
候 了 。 


第 521 行 ， 从 TCB 中 取得 用 户 程 序 在 内 存 中 的 基地 址 。 早 在 第 478 
行 ， 我 们 就 已 经 让 ESI 寄 存 器 指向 了 TCB 的 基地 址 。 当 然 ，TCB 的 基地 
址 位 于 栈 中 ， 也 可 以 从 栈 中 取得 。 


第 524 一 528 行 ， 因 为 用 户 程序 头 部 的 起 始 地 址 就 是 整个 用 户 程序 的 
起 始 地 址 ， 故 将 EDI 寄存 堪 的 内 容 传送 到 EAX 寄存 占 ， 作 为 过 程 
sys_routine seg sel:make seg descriptor 的 第 一 个 参数 ， 即 段 的 起 始 
地 址 。 接 着 ， 从 头 部 中 取得 用 户 程 序 头 部 段 的 长 度 ， 作 为 第 二 个 参数 传 
送 到 EBX 寄存 占 。 因 为 段 界限 是 段 的 长 度 减 一 ， 故 还 要 将 EBX 寄存 器 的 
内 容 减 1。 最 后 ， 作 为 第 三 个 参数 ， 在 ECX 寄存 器 中 置 入 段 的 属性 。 请 


参考 段 描述 符 的 格式 ， 可 以 知道 ， 这 征 一 个 32 位 的 可 读 写 数据 段 ， 字 市 
粒度 ， 尤 其 重要 的 是 ， 其 描述 符 特 权 级 DPL 为 3， 即 了 最 低 的 特权 级 。 这 是 


在 操作 系统 的 手 上 ， 由 它 来 负责 加 载 呢 1! 


调用 过 程 sys routine seg sel:make seg descriptor 后 ， 会 在 
EDX:EAX 中 返回 64 位 的 段 描述 符 。 第 531、532 行 用 于 调用 男 一 个 过 程 
fill_descriptor_in_ldt 把 刚才 创建 的 描述 符 安 装 到 LDT 中 。 


fill_descriptor_in_ldt 是 当前 内 核 代 码 段 的 内 部 〈 近 ) 过 程 ， 位 于 第 
421 行 ， 用 于 在 当前 任务 的 LDT 中 安装 描述 符 。 它 需要 传 入 两 个 参数 ， 
一 个 是 要 安装 的 描述 符 ， 由 EDX:EAX 共同 提供 ; 另 一 个 是 当前 任务 控制 
块 的 基地 址 ， 由 EBX 寄存 器 提供 。 它 用 这 个 地 址 来 访问 TCB 以 获得 LDT 
的 基地 址 和 当前 的 大 小 (界限 值 ) ， 并 在 安装 描述 符 后 更 新 LDT 的 界限 
值 。 


第 425 一 428 行 ， 执 行 例 行 的 现场 保护 工作 ， 将 过 程 中 用 到 的 各 个 寄 
存 莫 压 栈 你 扩 。 


第 430 一 433 行 ， 先 使 段 寄存 器 DS 指向 4GB 的 内 存 段 ， 然 后 ， 访 问 
TCB， 从 中 取出 LDT 的 基地 址 传送 到 EDI 寄存 器 。 


新 描述 符 的 线性 地 址 可 以 用 LDT 的 基地 址 加 上 LDT 的 总 字 节 数 得 
到 。 第 435 一 440 行 ， 计 算 用 于 安装 新 接 述 从 的 线性 地 址 ， 并 把 它 安 装 到 
那里 。 在 这 里 ，ECX 寄存 占有 了 两 个 相关 联 的 用 途 ， 一 个 是 在 第 439 和 
440 行 寻 址 内 存 ， 以 安装 描述 符 ; 另 一 个 是 在 第 436、437 行 用 于 计算 
LDT 的 大 小 ， 但 只 能 使 用 其 16 位 的 CX 部 分 。 想 想 看 ， 当 第 一 次 在 LDT 
中 安装 摘 述 符 时 ，LDT 的 界限 值 是 0xFFFF ， 加 1 之后， 总 大 小 是 
0x0000， 进 位 部 分 要 于 借 。 对 CX 寄存 需 的 操作 不 会 影响 到 ECX 寄存 需 
的 高 16 位 。 即 使 CX 寄存 器 产生 了 进位 ， 进 位 也 会 丢弃 ， 而 决 不 会 跑 到 
ECX 寄存 器 的 高 16 位 。 注 意 以 下 指令 执行 结果 的 不 同 : 


XOTrT eC- SCX ;CX 
人 


TC EC :GCx—=0 


XOr eCx,EeCcx CX 
MO CX 0XEEFE 


inc ecx ”ecX 一 0X00010000 


和 GDT 不 同 ，LDT 的 0 号 槽 位 也 是 可 用 的 。 原 因 在 于 ， 其 选择 子 的 
TI 位 是 “人 ， 所 以 不 可 能 会 有 一 个 全 零 的 选择 子 指 癌 LDT。 这 惑 是 说 ， 一 
个 指向 LDT 的 选择 子 代 入 段 寄 存 器 时 ， 它 不 可 能 是 因 程 序 员 粗心 大 意 而 
未 初始 化 的 。 

第 442、443 行 ， 将 LDT 的 总 大 小 〈( 字 节 数 ) 在 原来 的 基础 上 增加 8 
字 节 ， 再 减 去 1， 就 是 新 的 界限 值 。 第 445 行 ， 将 这 个 新 的 界限 值 更 新 到 
TCB 中 。 


第 447 一 450 行 ， 将 描述 符 的 界限 值 除 以 8， 人 余数 丢 弄 不 管 ， 所 得 的 
商 束 是 当前 新 描述 符 的 索引 号 。 

第 452 一 454 行 ， 将 CX 寄存 器 中 的 索引 号 逻辑 左 移 3 次 ， 并 将 TI 位 
置 1， 表 示 指 癌 LDT， 这 残 得 到 了 当前 描述 符 的 选择 子 。 

接着 回 到 过 程 load relocate_program 中 。 


过 程 f 册 descriptor in_ldt 在 LDT 中 安装 描述 符 后 ， 用 CX 寄存 器 返 
回 一 个 选择 子 。 第 534 一 536 行 ， 用 于 将 选择 子 的 请 求 特权 级 RPL 设置 为 
3， 登 记 到 TCB， 并 回填 到 用 户 程 序 头 部 。 在 LDT 中 安装 的 描述 从 ， 通 向 
只 由 用 户 程序 目 己 使 用 ， 即 ， 在 请 求 访问 这 些 段 时 ， 请 求 者 是 用 户 程 序 
自己 。 因 此 ， 其 选择 子 的 RPL 和 用 户 程序 的 特权 级 始终 一 致 。 


14.4.5 重 定 位 U-SALT 表 


接着 回 到 代码 清单 14-1 中 。 


从 第 539 行 开始 ， 一 直到 第 576 行 结束 ， 分 别 是 创建 用 户 程 序 代码 
段 、 数 据 段 和 栈 段 描述 符 ， 并 将 它们 安装 在 LDT 中 。 除 了 往 LDT 中 安装 
描述 符 ， 以 及 其 他 一 些 细节 上 的 差别 外 ， 这 部 分 代码 和 上 一 章 相 比 ， 大 
体 上 是 一 致 的 ， 都 很 好 理解 ， 不 需要 一 一 详 述 。 但 是 ， 必 须要 说 明 的 
是 ， 在 这 个 过 程 中 所 创建 的 段 摘 述 符 ， 其 特权 级 DPL 都 是 2， 而 且 ， 这 些 
段 描述 符 的 选择 子 ， 其 请 求 特 权 级 RPL 也 都 是 3。 

从 第 579 行 开始 ， 到 第 620 行 结束 ， 用 于 重 定 位 用 户 程 序 的 U-SALT 
表 。 和 第 13 间 相 比 ， 绝 大 多 数 代码 都 是 相同 的 ， 具 体 的 工作 流程 也 几 平 
没有 变化 。 当 然 ， 因 为 涉及 特权 级 ， 个 别 的 差异 还 是 有 的 。 

U-SALT 位 于 用 户 程序 头 部 段 。 为 了 访问 它 ， 第 14 章 的 做 法 是 先 用 
段 突 存 右 ES 指 回 用 户 程序 头 部 段 ， 再 访问 该 段 内 的 U-SALT 表 。 当 然 ， 


前 提 是 用 户 程序 头 部 段 的 描述 符 已 经 安装 并 开始 生效 。 

在 本 章 中 ， 用 户 程 序 各 个 段 的 描述 符 位 于 LDT 中 ， 尽 管 已 经 安装 ， 
但 还 没有 生效 (还 没有 加 载 局 部 描述 符 表 寄存 器 LDTR)〉。 在 这 种 情况 
下 ， 只 能 通过 4GB 的 段 来 访问 U-SALT。 所 以 ， 第 579、580 行 用 于 令 段 
寄存 项 ES 指 癌 4GB 的 内 存 段 。 在 前 面 的 代码 中 ， 是 令 EDI 寄存 器 指 问 用 
户 程 序 起 始 加 载 地 址 的 ， 这 也 融 是 用 户 程序 头 部 段 的 起 始 线性 地 址 。 
为 U-SALT 的 条 目 数 位 于 头 部 段 内 偏 移 0x24 处 。 故 ， 程 序 中 用 以 下 指令 
来 取得 该 条 有 目 数 (第 587 行 ) : 





mov ecx, [es:edi+0x24] 


同样 的 道理 ， 因 为 U-SALT 表 位 于 涉 部 段 内 偏 移 0x28 处 ， 要 想得到 
U-SALT 表 的 线性 基地 址 ， 使 EDI 寄存 右 指 同 它 ， 程 序 中 使 用 的 是 以 下 指 
令 (第 588 行 ) : 


add edi, 0x28 


具体 的 重 定位 过 程 在 第 13 章 里 已 经 讲 得 很 清楚 了 ， 无 非 就 是 找到 名 
字 相 同 的 C-SALT 条 目 ， 把 它 的 地 址 部 分 复制 到 U-SALT 的 对 应 条 目 中 。 
在 第 13 章 里 ， 复 制 的 是 16 位 的 代码 段 选择 子 和 32 位 的 段 内 偏 移 。 在 本 
革 中 ， 这 些 地 址 不 再 是 普通 的 段 选 择 子 和 上 段 内 偏 移 ， 而 是 调用 门 选 择 子 
和 上 段 内 偏 移 。 

当初 ， 在 创建 这 些 调用 门 时 ， 选 择 子 的 RPL 字段 是 0。 也 就 是 说 ， 这 
些 调用 门 选 择 子 的 请 求 特权 级 是 0。 妆 它们 被 复制 到 U-SALT 中 时 ， 应 当 
改 为 用 户 程 序 的 特权 级 (3) 。 

为 此 ， 第 605、606 行 ， 因 为 ESI 寄存 器 指向 当前 条 目的 地 址 部 分 ， 
所 以 4 字 节 之 后 的 地 方 是 该 地 址 的 选择 子 部 分 ， 需 要 首先 传送 到 AX 寄存 
锅 ; 紧 接 着 ， 修 改 它 的 RPL 字段 ， 使 该 选择 子 的 请 求 特权 级 为 3。 


14.4.6 ”创建 0、1 和 2 特权 级 的 栈 
任务 在 运行 时 ， 需 要 调用 内 核 或 者 操作 系统 的 例 程 。 这 可 以 认为 是 


从 同一 个 任务 的 局 部 地 址 空间 转移 到 全 局 地 址 空间 工作 。 而 且 ， 在 这 个 
过 程 中 涉及 特权 级 的 变化 ， 需 要 通过 调用 门 。 


通过 调用 | 门 的 控制 转移 通 第 会 改变 当前 特权 级 CPL， 同 时 还 要 切换 
到 与 目标 代码 段 特权 级 相同 的 栈 。 为 此 ， 必 须 为 每 个 任务 定义 额外 的 
栈 。 对 于 当前 的 3 特权 级 任务 来 说 ， 应 当 创 建 特权 级 0、1 和 2 的 栈 。 而 
且 ， 应 当 将 它们 定义 在 每 个 任务 自己 的 LDT 中 。 


这 些 额 外 的 栈 是 动态 创建 的 ， 而 且 需 要 登记 在 任务 状态 段 (TSS) 
中 ， 以 便 处 理 禹 固件 能 够 目 动 访问 到 它们 。 但 是 ， 现 在 的 问题 是 还 没有 
创建 TSS， 有 必要 先 将 这 些 栈 信 息 登 记 在 任务 控制 块 (TCB) 中 暂时 保 
仓 。 


第 622 行 ， 从 栈 中 取得 当前 任务 的 TCB 基地 址 ， 它 是 作为 过 程 参数 
压 在 当前 栈 中 的 。 


第 625 一 628 行 ， 申 请 创建 0 特权 级 栈 所 需 的 4KB 内 存 ， 并 在 TCB 
中 登记 该 栈 的 尺寸 。 登 记 到 TCB 中 的 尺寸 值 要 求 是 以 4KB 为 单位 的 ， 所 
以 ， 还 要 岂 辑 右 移 12 次 ， 相 当 于 除 以 4096， 人 得 到 一 个 4KB 的 倍数 。 


第 629、630 行 ， 先 申请 内 存 ， 然 后 用 申请 到 的 内 存 基 地 址 加 上 栈 的 
尺寸 ， 得 到 栈 的 高 端 地 址 ， 并 将 此 地 址 登记 到 TCB 中 。 一 般 来 说 ， 栈 应 
当 使 用 高 端 地 址 作为 其 线性 基地 址 。 

第 631、634 行 ， 用 给 定 的 段 界 限 和 段 属性 调用 公共 例 程 段 内 的 过 程 
make _seg _ descriptor 创建 描述 符 。 段 属性 表明 这 是 一 个 栈 段 ，4KB 粒 
上 度 。 我 们 创建 的 是 0 特权 级 栈 ， 故 要 求 描述 符 的 DPL 为 0。 

第 635、636 行 ， 调 用 内 核 代 码 段 内 的 近 过 程 f 仙 _descriptor_ in_ldt 将 
刚 创 建 的 描述 符 安 装 到 LDT 中 。 该 过 程 要 求 使 用 EBX 作为 参数 提供 TCB 
的 线性 基地 址 ， 故 在 调用 该 过 程 前 先 将 该 地 址 传送 到 EBX 寄存 器 。 

第 637 一 639 行 ， 将 安装 摘 述 从 后 返回 的 段 选 择 子 登记 在 TCB 中 。 
相应 地 ， 应 当 将 该 选择 子 的 请 求 尾 权 级 RPL 设置 为 0。 注 章 ， 过 程 返 回 的 
选择 子 本 来 就 是 RPL 为 0 的 ， 所 以 那 条 指令 是 作为 注释 存在 的 。 同 时 登 
记 的 还 有 0 特权 级 栈 指 针 的 初始 值 。 按 老 规 矩 ， 这 个 初始 值 应 当 为 0。 

第 642 一 673 行 是 创建 1、2 特权 级 的 栈 ， 并 将 它们 的 信息 登记 在 
TCB 中 ， 并 使 用 了 和 上 面相 同 的 方法 ， 要 注意 ， 为 它们 分 配 的 特权 级 别 
是 各 不 相同 的 。 


14.4.7 ”安装 LDT 描述 符 到 GDT 中 


尽 过 局 部 朱 述 符 表 〈LDT) 和 全 局 搬 述 从 表 (GDT) 都 用 来 存放 各 
种 持 述 符 ， 比 如 段 朱 述 待 ， 但 这 掩 兰 不 了 它们 也 十 内 存 段 的 事实 。 人 简单 
地 说 ， 它 们 也 是 段 。 但 是 ， 因 为 它们 用 于 系统 官 理 ， 故 称 为 系统 的 段 或 
系统 段 。 


全 局 描述 符 表 (GDT) 是 唯一 的 ， 整 个 系统 中 只 有 一 个 ， 所 以 只 需 
要 用 GDTR 寄存 器 存放 其 线性 基地 址 和 上 段 界 限 即 可 ， 但 LDT 不 同 ， 每 个 
任务 一 个 ， 所 以 ， 为 了 追踪 它们 ， 处 理 器 要 求 在 GDT 中 安装 每 个 LDT 的 
摘 述 符 。 当 要 使 用 这 些 LDT 时 ， 可 以 用 它们 的 选择 子 来 访问 GDT， 将 
LDT 描述 符 加 载 到 LDTR 寄存 器 。 在 一 些 人 看 来 ， 这 个 理由 很 牵强 ， 这 
么 做 也 很 别扭 。 但 是 ， 如 果 不 这 样 ， 处 理 器 将 没有 机 会 来 做 存储 器 和 特 
权 级 的 保护 工作 。 

第 676 一 679 行 ， 调 用 公共 例 程 段 的 过 程 make_seg_descriptor 创建 
LDT 描述 符 。 作 为 传 入 的 参数 ，EAX 寄存 器 的 内 容 是 从 TCB 中 取出 的 
LDT 基地 址 ，EBX 寄存 器 的 内 容 是 从 TCB 中 取出 的 LDT 长 度 ，ECX 寄 
存 器 的 内 容 是 描述 符 的 属性 ， 各 属性 位 与 它们 在 描述 符 高 32 位 中 相同 ， 
无 关 的 位 要 清 零 。 如 网 14-16 所 示 ， 这 是 LDT 描述 符 的 格式 。 

LDT 本 映 也 是 一 种 特殊 的 段 ， 最 大 尺寸 是 64KB。 段 基地 址 指示 LDT 
在 内 存 中 的 起 始 地 址 ， 段 界限 指示 LDT 的 范围 ， 描 述 符 的 G 位 是 粒度 
位 ， 适 用 于 LDT 描述 符 ， 以 表示 LDT 的 界限 值 是 以 字 节 为 单位 ， 还 是 以 
4KB 为 单位 。 即 使 是 以 4KB 为 单位 ， 它 也 不 能 超过 64KB 的 大 小 。 

D 位 (或 者 叫 B 位 ) 和 L 位 对 LDT 描述 符 来 说 没有 意义 ， 固 定 为 0。 

AVL 和 P 位 的 含义 和 存储 占 的 段 搬 述 从 相同 。 

LDT 描述 符 中 的 S 位 固定 为 0， 表 示 系 统 的 段 描述 符 或 者 门 描述 符 ， 
以 相对 于 存储 器 的 段 描述 符 〈S=1) ， 因 为 LDT 描述 符 属 于 系统 的 段 描 
述 从 。 


31 24 23 22 21 20 19 16 13 14 13 12 11 8 


3 0 
A 
Ob 0101o1110 
0 


31 10 15 





图 14-16 LDT 描述 符 的 格式 


在 描述 符 为 系统 的 段 描述 符 时 ， 即 ， 在 S=0 的 前 提 下 ，TYPE 字段 
为 0010 二进制 ) 表明 这 是 一 个 LDT 描述 符 。 

因此 ， 传 送 到 ECX 寄存 颖 的 属性 值 0x00408200 表示 这 是 一 个 LDT 
描述 符 ， 描 述 符 特权 级 DPL 为 0， 其 他 无 关 的 位 都 已 清 零 。 

过 程 返 回 后 ， 创建 的 摘 述 从 在 EDX:EAX 中 。 第 680 、681 行 ， 并 
即 调用 过 程 set up gdt descriptor 安装 此 描述 符 到 全 局 描述 符 表 GDT 
中 。 然 后 ， 将 返回 的 描述 符 选 择 子 写 入 任务 控制 块 TCB 中 的 相应 位 置 。 


14.4.8 ”任务 状态 段 TSS 的 格式 


到 目前 为 止 ， 任 务 的 所 有 内 存 段 都 已 创建 完毕 ， 除 了 任务 状态 段 
(TSS) 。 现 在 就 来 创建 TSS。 在 此 之 前 ， 先 来 全 面 了 解 一 下 TSS 的 各 
个 组 成 部 分 。 

如 图 14-2 所 示 ，TSS 内 偏 移 0 处 是 前 一 个 任务 的 TSS 摘 述 符 选 择 
子 。 和 LDT 一 样 ， 必 须 在 全 局 摘 述 符 表 (GDT) 中 创建 每 个 TSS 的 描述 
符 。 当 系统 中 有 多 个 任务 同时 存在 时 ， 可 以 从 一 个 任务 切换 到 另 一 个 任 
务 执 行 ， 此 时 称 任务 是 散 套 的 。 被 舱 套 的 任务 用 这 个 指针 指 癌 前 一 个 任 
务 ， 即 藤 套 它 的 那个 任务 ， 当 控制 返回 前 一 个 任务 时 ， 处 理 器 需要 这 个 
指针 来 识别 前 一 个 任务 。 创 建 TSS 时 ， 可 以 为 0。 


SS0、SS1 和 SS2 分 别 是 0、1 和 2 特权 级 的 栈 段 选择 子 ，ESP0、 
ESP1 和 ESP2 分 别 是 0(、1 和 2 特权 级 栈 的 栈 顶 指针 。 这 些 内 容 应 当 由 任 
务 的 创建 者 填写 ， 且 属于 填写 后 一 般 不 变 的 静态 部 分 ， 当 通过 门 进 行 特 
权 级 之 间 的 控制 转移 时 ， 处 理 器 用 这 些 信息 来 切换 栈 。 


CR3 和 分 页 有 关 ， 有 天 分 页 的 知识 将 在 第 16 章 讲 述 。 此 处 一 般 由 任 
务 的 创建 者 填写 ， 如 采 没 有 使 用 分 页 ， 可 以 为 0。 


偏 移 为 32 一 92 的 区 域 是 处 理 嚣 各 个 寄存 恬 的 快照 部 分 ， 用 于 在 进行 
任务 切换 时 ， 你 存 处 理 占 的 状态 以 便 将 来 恢复 现场 。 在 一 个 多 任务 环境 
中 ， 每 次 创建 一 个 任务 时 ， 操 作 系 统 或 者 内 核 至 少 要 填写 EIP 、 
EFLAGS、ESP、CS、SS、DS、ES、FS 和 GS， 当 该 任务 第 一 次 获得 
执行 时 ， 处 理 堪 从 这 里 加 载 初 始 执行 环境 ， 并 从 CS:EIP 处 开始 执行 任务 
的 第 一 条 指令 。 在 此 之 后 的 任务 运行 期 间 ， 该 区域 的 内 容 由 处 理 占 固件 


进行 更 改 。 在 本 章 中 ， 只 有 一 个 任务 ， 而 且 目 进入 保护 模 陈 时 吏 开 始 运 
行 了 ， 只 不 过 一 开始 是 在 0 特权 级 的 全 局 空间 执行 。 所以， 这 部 分 内 容 个 


前 要 坦 与 。 


LDT 段 选择 子 是 当前 任务 的 LDT 描述 符 选择 子 。 由 内 核 或 者 操作 系 
统 填 写 ， 以 指向 当前 任务 的 LDT。 该 信息 由 处 理 器 在 任务 切换 时 使 用 ， 
在 任务 运行 期 间 保 持 不 变 。 


T 位 用 于 软件 调试 。 在 多 任务 的 环境 中 ， 如 果 T 位 是 1"， 每 次 切换 
到 该 任务 时 ， 将 引发 一 个 调试 异常 中 断 。 这 是 有 益 的 ， 调 试 程序 可 以 接 
管 该 中 断 以 显示 任务 的 状态 ， 并 执行 一 些 调试 操作 。 现 在 只 需要 将 这 一 
位 清 零 即 可 。 


WO 映射 基地 址 用 于 决定 当前 任务 是 否 可 以 访问 特定 的 硬件 端口 ， 对 
它 的 解释 说 来 话 长 。 

是 这 样 的 ， 我 们 知道 ， 特 权 指令 是 只 有 0 特权 级 的 程序 才 可 以 执行 的 
指令 ， 执 行 这 些 指令 会 影响 整个 机 器 的 状态 。 

现 有 的 特权 指令 也 许 是 处 理 器 的 设计 者 精心 挑选 的 ， 因 为 即使 较 低 
特权 级 的 程序 不 使 用 它们 ， 这 些 程序 也 能 运行 得 很 好 ， 简 直 是 非常 好 ， 
不 过 ， 另 外 一 些 候选 的 指令 就 没 那么 幸运 了 ， 尽 管 它们 也 适合 作为 特权 
指令 ， 但 其 他 特权 级 的 程序 同样 需要 它们 。 

一 个 典型 的 例子 是 硬件 端口 的 输入 输出 指令 in 和 out， 它 们 应 该 对 特 
权 级 别 为 1 的 程序 开放 ， 因 为 设备 驱动 程序 就 工作 在 这 个 特权 级 别 。 不 
过 ， 这 样 做 依然 是 不 合理 的 ， 因 为 即使 是 特权 级 为 3 的 程序 ， 在 需要 快速 
反应 的 场合 ， 也 需要 直接 访问 某 些 硬件 端口 。 所 以 ， 如 果 需 要 ， 它 们 也 
可 以 向 2、3 特权 级 的 程序 开放 。 


处 理 需 可 以 访问 65536 个 硬件 端口 。 如 果 只 对 应 用 程序 开放 那些 它 
们 需要 的 端口 ， 而 禁止 它们 访问 男 一 些 敏感 的 端口 ， 操 作 系 统 肯 定 会 对 
此 持 欢 迎 态 度 ， 因 为 这 有 利于 设备 的 统一 管理 ， 同 时 也 很 安全 。 


每 个 任务 都 有 EFLAGS 寄存 需 的 副本 ， 其 内 容 在 任务 创建 的 时 候 由 
内 核 或 者 操作 系统 初始 化 ， 在 多 任务 系统 中 ， 每 次 当 任 务 恢复 运行 时 ， 
束 由 处 理 亏 固件 目 动 从 TSS 中 恢复 。 

EFLAGS 寄存 需 的 IOPL 位 决定 了 当前 任务 的 I/O 特权 级 别 。 如 果 当 
前 特权 级 CPL 高 于 ， 或 者 和 任务 的 VO 特权 级 IOPL 相同 时 ， 即 ， 在 数值 
二 


CPL IOPL 


时 ， 所 有 IO 操作 都 是 允许 的 ， 针 对 任何 便 件 站 口 的 访问 都 可 以 通过 。 


相反 ， 如 有 果 当 前 特权 级 CPL 低 于 任务 的 VO 特权 级 IOPL， 也 并 不 意 
味 看 所 有 的 人 硬件 端口 都 对 当前 任务 关上 了 大 门 。 事 实 上 ， 处 理 喜 的 意思 
是 总 体 上 不 允许 ， 但 个 别 端口 除外 。 至 于 个 别 端口 是 哪些 端口 ， 要 找到 
当前 任务 的 TSS， 并 检索 WO 许可 位 串 。 

如 图 14-17 所 示 ，1/O 许可 位 串 (I/O Permission Bit String) 是 一 个 
比特 序列 ， 或 者 说 是 一 个 比特 串 ， 最 多 允许 65536 比特 ， 即 8KB。 从 第 1 
比特 开始 ， 各 比特 用 它 在 串 中 的 位 置 代表 一 个 端口 号 。 因 此 ， 第 1 个 比特 
代表 0 号 端口 ， 第 2 个 比特 代表 1 号 疾 口 ， 第 3 个 比特 代表 2 号 关口， 
a ， 第 65536 比特 代表 第 65535 号 端口 。 


端口 0， 禁 止 访问 





问 口 65535， 禁 止 访问 





端口 1， 人 允许 访问 、 
端口 6， 人 允许 访问 





图 14-17 ”最 大 长 度 的 VO 许可 位 串 示 意图 


每 个 比特 的 取 值 决定 了 相应 的 端口 是 否 允 许 访 问 。 为 1 时 ， 禁 止 访 
问 ; 为 0 时 ， 人 允许 访问 。 

处 理 占 检查 I/O 许可 位 的 方法 是 先 计 算 它 在 Il/O 许可 位 映射 区 的 字 
编号 ， 并 读 取 该 字 节 ， 然 后 进行 测试 。 比 如 ， 当 执行 指令 


out Ox09,al 


时 ， 处 理 占 通过 计算 就 可 以 知道 ， 该 端口 对 应 看 I/O 许可 位 映射 区 第 2 个 
字 节 的 第 2 个 比特 (位 1) 。 于 是 ， 它 读 取 该 字 节 ， 并 测试 那 一 位 。 

同 其 他 和 任务 相关 的 信息 一 样 ，I/O 许可 位 串 位 于 任务 的 TSS 中 。 如 
图 14-18 所 示 ， 任 务 状态 段 TSS 的 最 小 长 度 是 104 字 节 ， 你 和 存 看 最 基本 
的 任务 信息 ， 但 这 并 不 是 它 的 最 大 长 度 。 

事实 上 ， 整 个 TSS 还 可 以 包括 一 个 lO 许可 位 串 ， 它 所 占用 的 区 域 称 
为 I/O 许可 位 映射 区 。 如 图 14-18 所 示 ， 在 TSS 内 仿 移 为 102 的 那个 字 单 
元 ， 你 和 存 看 I/O 许可 位 串 (I/O 许可 位 映射 区 ) 的 起 始 位 置 ， 从 TSS 的 起 


始 处 “0) 算 起 。 因 此 ， 如 果 该 字 单 元 的 内 容 大 于 或 者 等 于 TSS 的 段 界 限 
(在 TSS 描述 符 中 ) ， 则 表明 没有 I/O 许可 位 串 。 在 这 种 情况 下 ， 如 果 当 
前 特权 级 CPL 低 于 当前 的 I/O 特权 级 IOPL， 执 行 任何 硬件 VO 指令 都 会 引 
发 处 理 器 异常 中 断 。 说 明 一 下 ， 和 LDT 一 样 ， 必 须 在 GDT 中 创建 TSS 的 
描述 符 ，TSS 描述 符 中 包括 了 TSS 的 基地 址 和 界限 ， 该 界限 值 包括 IJ/O 
许可 位 映射 区 在 内 。 


映射 区 最 后 一 个 学 
节 的 所 有 比特 必须 
都 是 ] o 即 » 最 后 一 
个 字 节 是 0xFF 


1/O 许 可 位 映射 区 


一 OR 于 下 








前 一 个 任务 的 指针 (TSS) | 0 
图 14-18 TSS 中 的 VO 许可 位 映射 区 


非常 重要 的 一 点 是 ，VO 端口 是 按 字 节 编 址 的 。 这 人 句 话 的 意思 是 ， 
个 端口 仅 被 设计 用 来 读 写 一 个 字 节 的 数据 ， 当 以 字 或 者 双 字 访问 时 ， 实 
际 上 是 访问 连续 的 2 个 或 者 4 个 端口 。 比 如 ， 当 从 端口 n 读 取 一 个 字 时 ， 
相当 于 同时 从 端口 n 和 端口 n 十 1 各 读 取 一 个 字 节 。 即 ， 


TSX OUX3ES 


相当 于 同时 执行 
9 al 0x3ES 
in ah , 0x3f9 ; 仅 为 示例 ，x86 处 理 器 不 允许 使 用 AH 寄存 器 


由 于 这 个 原因 ， 当 处 理 硕 执行 一 个 字 或 者 双 字 Jo 指令 时 ， 会 检查 许 
可 位 加 中 的 2 个 ， 或 者 4 个 连续 位 ， 而 且 了 要求 它们 必须 都 是 "0"， 人 否则 引 及 
异常 中 断 。 腑 烦 在 于 ， 这 些 连续 的 位 可 能 是 跨 字 市 的 。 即 ， 一 些 位 于 前 
一 字 节 ， 另 一 些 位 于 后 一 字 闻 。 为 此 ， 处 理 嚣 每 次 都 要 从 WO 许可 位 映射 
区 读 两 个 连续 的 字 市 。 


这 种 操作 廊 式 耳 接 导 人 怪 了 为 一 个 问题 。 即 ， 如 下 要 检 僵 的 比特 在 最 
后 一 字 节 中 ， 那 么 ， 这 个 两 字 贡 的 读 操 作 将 会 越界 。 为 防止 这 种 情况 ， 
处 理 占 要 求 /O 许可 位 映射 区 的 最 后 必须 附加 一 个 额外 的 字 节 ， 并 要 求 它 
的 所 有 比特 部 十 “1*"， 即 0xFF。 妆 然 ， 它 必须 位 于 TSS 的 界限 之 内 。 


处 理 帮 不 要 求 为 每 一 个 1/O 闹 口 都 提供 位 映 里 。 对 于 那些 没有 在 该 区 
域内 映射 的 位 ， 处 理 器 假定 它 对 应 的 比特 是 "1”。 例 如 ， 要 是 |/O 许可 位 映 
射 区 的 长 度 是 11 字 市 ， 那 么 ， 除 去 最 后 一 个 所 有 比特 都 是 “1 的 字 广 ， 前 
10 字 节 了 脆 射 了 80 个 疹 口 ， 分 别 是 闯 口 0 到 端口 79， 访 问 更 高 地 址 的 端口 
将 引发 异 钊 中断 。 

显然 ，EFLAGS 寄存 器 中 的 IOPL 位 对 于 控制 任务 的 VO 特权 来 说 是 
很 重要 的 。 通 利 ，IOPL 位 由 内 核 或 者 操作 系统 根据 任务 的 实际 需要 进行 
人 已 始 化 。 尽 党 不 存在 对 EFLAGS 寄存 右 整 体 写 入 或 者 读 出 的 指令 ， 但 存 
在 将 标志 寄存 器 入 栈 和 出 栈 的 指令 : 


Dusnt ousnfa 
Bopf/Boptd 


pushf 并 不 是 一 条 新 指令 。 事 实 上 ， 早 在 8086 处 理 器 的 时 代 就 已 经 
有 了 ， 用 于 将 16 位 的 标志 寄存 器 FLAGS 压 栈 ， 机 器 指令 码 为 9C。 在 
8086 处 理 器 上 执行 时 ，SP 寄存 器 的 内 容 减 去 2， 然 后 将 FLAGS 的 内 容 
保存 到 栈 段 ， 操 作 数 的 大 小 是 1 个 字 。 同 样 地 ，popf 指令 把 当前 栈 中 的 
栈 顶 内 容 弹 出 到 FLAGS 寄存 器 。 


到 了 32 位 处 理 器 时 代 ，pushf 指令 既 可 以 工作 在 16 位 模式 下 ， 也 可 
以 工作 在 32 位 模式 下 。 在 16 位 模式 下 ，pushf 压 入 的 是 EFLAGS 的 低 16 
位 。 如 果 要 压 入 整个 32 位 的 EFLAGS， 需 要 指令 前 级 66， 即 


6 IC 


在 32 位 模式 下 ，pushf 压 入 的 是 整个 32 位 的 EFLAGS， 即 使 有 指令 
前 级 ， 也 不 会 只 压 入 低 16 位 ， 多 总 比 少 好 ， 只 压 入 低 16 位 没有 太 大 意 
义 ， 徒 增 处 理 器 的 负担 。 

为 了 区 分 EFLAGS 寄存 左 在 16 位 模式 下 的 两 种 压 栈 方式 ， 编 译 鼎 引 
入 了 符号 pushfd。 本 质 上 ， 它 们 对 应 看 同一 条 指令 ， 当 你 使 用 pushf 时 ， 
编译 器 束 知 道 ， 应 当 编 译 成 无 前 级 的 机 占 人 码 9C; 当 使 用 pushfd 时 ， 编 译 
髓 会 编译 成 66 9C。 下 面 的 例子 很 好 地 展示 了 它们 之 间 的 区 别 : 


[bits 16] 
pushf ; 编译 后 是 9Cc，16 位 操作 
pushfdq ; 编译 后 是 66 9c，32 位 操作 
[Bis 32| 

pushf ; 编译 后 是 9Cc，32 位 操作 
pushfd ; 编译 后 同样 是 9Cc，32 位 操作 


可 见 ， 在 32 位 模式 下 ，pushf 和 pushfd 是 相同 的 。 上 面 的 讨论 同样 
适用 于 popf 和 popfd 指令 。 

通过 将 EFLAGS 寄存 器 的 内 容 压 入 栈 ， 局 部 修改 后 ， 再 弹出 到 
EFLAGS， 可 以 间接 地 改变 它 的 各 种 标志 位 。 对 多 数 标记 位 的 修改 不 会 
威胁 到 整个 系统 的 安全 ， 比 如 ， 你 修改 了 ZF 标志 ， 这 有 什么 用 呢 ? 唯 一 
的 后 果 可 能 是 搬 石 头 古 目 己 程序 的 脚 。 

但 是 ， 如 果 修 改 了 IOPL 位 和 IF 位 ， 就 不 同 了 。 能 够 修改 这 两 个 标志 
的 指令 是 


Go Tret CLII Sti 


注意 ， 疫 有 包括 pushf 指令 ， 原 因 来 目 一 个 阴险 的 想法 :你 可 以 执行 
pushf 指令 ， 但 我 不 允许 你 执行 popf 和 iret 指令 ， 你 束 生 气 吧 ! 万 外 ， 中 
潜 是 由 操作 系统 或 者 内 核 统 一 官 理 的 ，cli 和 sti 指 令 不 能 由 低 特 权 级 的 程 


序 随便 执行 。 遗 憾 的 是 ， 这 些 指令 并 不 是 特权 指令 ， 原 因 很 简单 ， 其 他 
特权 级 的 程序 也 离 不 开 它 们 。 

最 好 的 办 法 是 用 IOPL 本 里 来 控制 它们 。 如 果 当 前 特权 级 CPL 高 于 ， 
或 者 和 当前 Il/O 特权 级 IOPL 相同 ， 即 ， 在 数值 上 


CRE< TOBREE 


则 允许 执行 以 上 4 条 指令 ， 也 人 允许 访问 所 有 的 硬件 端口 。 人 否则， 如果 
当前 特权 级 CPL 低 于 当前 的 1/O 特权 级 IOPL， 则 执行 popf 和 iret 指令 
时 ， 会 引发 处 理 器 异常 中 断 ， 执 行 clj 和 sti 时 ， 不 会 引发 异常 中 断 ， 但 不 
改变 标志 寄存 部 的 IF 位 。 同 时 ， 是 否 能 访问 特定 的 |/O 剖 口 ， 要 参考 TSS 
中 的 I/O 许可 位 映射 串 。 


14.4.9 创建 任务 状态 段 TSS 


回 到 代码 清单 14-1， 我 们 来 创建 任务 状态 段 TSS。 

第 684 一 688 行 ， 申 请 104 字 节 的 内 存 用 于 创建 TSS。 很 显然 ， 我 们 
是 要 创建 一 个 标准 大 小 的 TSS。 照 例 ， 要 把 TSS 的 基地 址 和 界限 登记 到 
任务 控制 块 (TCB) 中 ， 将 来 创建 TSS 描述 符 时 用 得 着 。TSS 的 界限 值 
是 16 位 的 ， 是 它 的 大 小 (总 字 节 数 ) 减 1， 这 束 是 第 686 行 的 目的 。 

注意 ， 界 限 值 必须 至 少 是 103， 任 何 小 于 该 值 的 TSS， 在 执行 任务 切 
换 时 ， 都 会 引发 处 理 器 异常 中 汤 。 


第 691 行 ， 将 指 癌 前 一 个 任务 的 指针 (任务 链接 域 〉 填 写 为 0， 表 明 
这 是 唯一 的 任务 。 

第 693 一 709 行 ， 登 记 0、1 和 2 特权 级 栈 的 段 选择 子 ， 以 及 它们 的 初 
始 栈 指针 。 所 有 的 栈 信 息 都 在 TCB 中 ， 先 从 TCB 中 取出 ， 然 后 填写 到 
TSS 中 的 相应 位 置 。 

第 711、712 行 ， 登 记 当 前 任务 的 LDT 描述 符 选择 子 。 在 任务 切换 
上 时， 处理 器 需要 用 这 里 的 信息 找到 当前 任务 的 LDT。LDT 对 任务 来 说 并 
不 是 必需 的 ， 如 果 高 兴 ， 也 可 以 把 属于 某 个 任务 的 段 定 义 在 GDT 中 。 如 
果 没 有 LDT， 这 里 应 该 填写 0。 

第 714、715 行 ， 填 写 J/O 许可 位 映射 区 的 地 址 。 在 这 里 ， 填 写 的 是 
TSS 段 界 限 〈103) ， 这 意味 着 不 存在 该 区 域 。 


14.4.10 “安装 TSS 描述 符 到 GDT 中 


和 局 部 描述 符 表 〈LDT) 一 样 ， 也 必须 在 GDT 中 安装 TSS 的 描述 
。 这 样 做 ， 一 方面 是 为 了 对 TSS 进行 段 和 特权 级 的 检查 ; 另 一 方面 ， 
也 是 执行 任务 切换 的 要 。 当 call far 和 jmp far 指令 的 操作 数 是 TSS 描述 
符 选 择 子 时 ， 处 理 吉 执行 任务 切换 操作 。 


如 图 14-19 所 示 ， 这 是 TSS 摘 述 符 的 格式 ， 和 LDT 摘 述 符 差 不 多 ， 
除了 TYPE 位 。 


TSS 描述 符 中 的 B 位 是 “ 忙 " 位 (Busy)〉。 在 任务 刚刚 创建 的 时 候 ， 
它 应 该 为 二 进 制 的 1001， 即 ，B 位 是 0， 表 明 任 务 不 全。 当 任 务 开始 执行 
时 ， 或 者 处 于 挂 起 状态 (临时 被 中 断 执 行 ) 时 ， 由 处 理 右 固件 把 B 位 置 
1。 


任务 是 不 可 重 入 的 。 束 是 说 ， 在 多 任务 环境 中 ， 如 琳 一 个 任务 十 当 
前 任务 ， 它 可 以 切换 a 到 其 他 任务 ， 但 不 能 从 目 己 切换 到 自己。 在 TSS 描 
述 休 中 设置 B 位 ， 并 由 处 理 亏 固件 进行 管理 ， 可 以 防止 这 种 情况 的 妈 
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图 14-19 TSS 描述 符 的 格式 


第 720 一 725 行 ， 先 调用 公共 例 程 段 内 的 过 程 make_seg_descriptor 
创建 TSS 摘 述 符 ， 它 需要 传 入 三 个 参数 。 先 从 TCB 中 取出 TSS 的 基地 
址 ， 传送 到 EAX 寄存 匿 ; EBX 寄存 右 的 内 容 是 TSS 的 界限 ;ECX 寄存 

器 的 内 容 是 描述 符 属 性 值 ，0x00408900 表明 这 是 一 个 DPL 为 0 的 TSS 
描述 符 ， 字 节 粒 上 度 。 接 着 ， 调 用 公共 例 程 段 内 的 另 一 个 过 程 
set up gdt en 汪 机 此 描述 得 到 GDT 中 ， 并 将 返回 的 描述 符 选 择 
子 登 记 在 TCB 中 。TSS 描述 符 选 择 子 的 RPL 字段 为 0。 


14.4.11 “市 参数 的 过 程 返 回 指令 


至 此 ， 任 务 创建 完毕 ， 可 以 从 过 程 Ioad_relocate_program 返回 了 。 

在 过 程 返回 之 前 ， 即 ， 在 执行 ret 指令 之 前 ， 需 要 恢复 现场 ， 也 就 是 
按 相 反 的 顺序 将 刚 进 入 过 程 时 压 入 栈 的 内 容 出 栈 。 这 是 第 727 一 730 行 的 
J 

如 图 14-20 所 示 ， 当 执行 ret 指令 时 ， 栈 恢复 到 刚 进入 过 程 时 的 状 
态 ， 即 ， 只 有 返回 地 址 和 调用 者 传递 给 过 程 的 参数 。 因 为 当初 是 采用 32 
位 相对 近 调 用 进入 过 程 load relocate program 的 ， 故 仅 将 EIP 压 栈 ， 没 
有 压 入 段 寄 存 需 CS 的 内 容 。 
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图 14-20 ”执行 ret 指令 时 的 栈 状态 


青玉 看， 一 旦 ret 指令 执行 完毕 ， 控 制 将 返回 到 调用 者 ， 且 栈 中 只 剩 
下 两 个 参数 。 按 道理 ， 这 两 个 参数 是 由 调用 者 压 入 的 ， 应 该 再 由 调用 者 
弹出 即 可 : 


栈 推进 方 癌 


push dword 50 ;用户 程序 位 于 逻辑 50 局 区 

Push ecx ; 压 入 任务 控制 块 起 始 线 性 地 址 

call ioad relocater Drogram ; 调用 过 程 

add esp, 8 ; 过程 返回 后 ， 调 整 栈 指针 使 之 越过 参数 


不 过 ， 最 好 的 解决 办 法 是 在 过 程 返 回 时 ， 顺 便 弹 出 参数 。 这 样 做 十 
可 行 的 ， 过 程 的 编写 者 最 清楚 栈 中 有 有 几 个 参数 。 如 来 布 望 过 程 在 返回 时 


弹出 参数 ， 使 ESP 和 寄存 苍 J 才 程 前 的 栈 位 置 “ 使 栈 平 衡 ) ， 可 以 
使 用 市 操作 数 的 过 程 返 回 指令 


ret imml6 


retf imml6 


这 两 条 指令 部 允许 16 位 的 立即 数 作 为 操作 数 ， 不 同 之 处 仅仅 在 于 ， 
前 者 征 近 返回 ， 后 首 丰 还 返 问 。 闻 即 数 是 16 位 的 ， 而 且 一 般 总 是 偶数 ， 
et 是 以 字 或 者 双 字 进行 ， 它 指示 在 将 控制 返回 到 调用 者 之 

， 应 当 从 栈 中 弹出 多 少 字 节 的 数据 。 


因此 ， 第 732 行 ， 当 该 指令 执行 时 ， 除 了 将 控制 返回 到 过 程 的 调用 
者 之 外 ， 还 要 调整 栈 的 指针 ， 即 


ESP<ESP 十 8 


之 所 0 是 因为 要 弹出 2 个 双 字 。 


这 条 指令 给 融 局 级 语言 市 来 的 好 处 是 增加 了 它们 的 复 条 性 。 比 如 这 样 
= 语言 贞 言 疯 数 : 


Volid Tunc(nt 1 char ey 
/* 这 里 是 函数 体 */ 
} 


因为 一 般 是 通过 栈 传 递 参数 ， 所 以 ， 哪 个 参数 先入 栈 ， 哪 个 后 入 
栈 ， 栈 平衡 的 事情 由 调用 者 来 做 ， 还 是 由 过 程 来 做 ， 融 需要 一 个 标准 ， 
即 所 谓 的 调用 转换 规则 。 特 别 是 在 开发 一 些 大 软件 时 ， 需 要 用 不 同 的 高 
级 语言 来 开发 各 个 独立 的 、 但 能 够 协同 工作 的 模块 ， 尤 其 需要 注意 这 个 
问题 。 

个 典型 的 调用 转换 标准 是 stdcall， 它 规定 ， 参 数 从 右 往 左 进 栈 ， 且 
由 过 J 程 在 瓜 回 前 出 栈 ， 


14.5 用户 程序 的 执行 
14.5.1 通过 调用 门 转移 控制 的 完整 过 程 


现在 我 们 转 到 代码 清单 14-1 的 第 845、846 行 ， 在 调用 过 程 
load_relocate_program 创建 任务 之 后 ， 显 示 一 条 成 功 的 消 明 。 


接 下 来 的 工作 是 将 控制 转 到 用 户 程 序 那 里 。 我 们 创建 的 是 一 个 3 特权 
级 的 任务 ， 所 以 这 是 一 个 从 0 特权 级 到 3 特权 级 的 控制 转移 。 或 者 ， 换 一 
种 更 体面 的 说 法 ， 是 从 任务 自己 的 0 特权 级 全 局 空间 转移 到 3 特权 级 局 部 
空间 执行 。 通 党 情况 下 ， 这 既 不 允许 ， 也 不 太 可 能 。 

办 法 忌 还 是 有 的 ， 只 不 过 稍微 有 一 点 曲折 ， 那 束 是 假装 从 调用 门 返 
回 。 先 来 看 看 完整 的 调用 门 控 制 转移 和 返回 过 程 是 怎样 的 。 

首先 ， 通 过 调用 门 实施 控制 转移 ， 可 以 使 用 jimp far 和 call far 指令 。 
指令 执行 时 ， 搬 述 符 选择 子 必须 指 同 调用 门 ，32 位 偏 移 量 被 忽略 。 但 ， 
无 论 采 用 哪 种 控制 转移 指令 ， 都 会 使 用 表 14-1 的 特权 检查 规则 。 注 意 ， 
表 中 的 比较 关系 都 是 数值 上 的 。 


表 14-1 调用 门 的 特权 级 检查 规则 


特权 检查 规则 
CPL 三 调用 门 描 述 符 的 DPL，RPL 三 调用 门 描 述 符 的 DPL 
对 于 依从 和 非 依 从 的 代码 段 CPL 三 目标 代码 段 描述 符 的 DPL 


CALL FAR 





CPL 三 调用 门 描 述 符 的 DPL，RPL 三 调用 门 描 述 符 的 DPL 
JMP FAR 若 目 标 代码 段 是 依从 的 : CPL 三 目标 代码 段 描述 符 的 DPL 
若 目 标 代 码 段 是 非 依从 的 : CPL== 目 标 代 码 段 描述 符 的 DPL 


从 表 15-1 中 可 以 看 出 ， 当 使 用 mp far 指令 通过 调用 门 转移 控制 时 ， 
要 求 当 前 特权 级 和 目标 代码 段 的 特权 级 相同 。 原 因 是 用 jmop far 指令 通过 
调用 门 转移 控制 时 ， 不 改变 当前 特权 级 CPL。 


相反 ， 使 用 call far 指令 可 以 通过 调用 门将 控制 转移 到 较 遍 特权 级 别 
的 代码 段 。 之 所 以 次 "可 以 ”"， 和 是 因 为， 如 条 目标 代码 段 是 依从 的 ， 则 和 
jmp far 指令 一 样 ， 不 改变 当前 特权 级 列 ; 否则， 如 果 目 标 代码 段 是 非 依 
从 的 ， 则 在 目标 代码 段 的 特权 级 别 上 换行 。 


其 次 ， 当 使 用 call far 指令 通过 调用 门 转移 控制 时 ， 如 果 改 变 了 当前 
的 特权 级 别 ， 则 必须 切换 栈 。 即 ， 从 当前 任务 的 固有 栈 切 换 到 与 目标 代 
码 段 特权 级 相同 的 栈 上 。 栈 的 切换 是 由 处 理 噩 固件 目 动 进行 的 。 

当前 栈 是 由 段 寄 存 器 SS 和 栈 指针 寄存 器 ESP 的 当前 内 容 指示 的 ; 
要 切换 到 的 新 栈 位 于 当前 任务 的 TSS 中 ， 处 理 器 知道 如 何 找到 它 。 在 栈 
切换 前 ， 处 理 器 要 检查 新 栈 是 否 有 足够 的 空间 完成 本 次 控制 转移 。 栈 切 
换 过 程 如 下 : 

人 使 用 目标 代码 段 的 DPL 〈 也 惑 是 新 的 CPL) 到 当前 任务 的 TSS 中 
选择 一 个 栈 ， 包 括 栈 段 选择 子 和 栈 指针 。 

@) 从 TSS 中 讯 取 所 选择 的 段 选择 子 和 栈 指针 ， 并 用 该 选择 子 谈 取 栈 
段 拉 述 符 。 在 此 期 间 ， 任 何 违 反 段 界限 检查 的 行为 都 将 引发 处 理 嚣 异 和 党 
中 断 〈 无 效 TSS) 。 


(3 从 得 栈 段 朱 述 符 的 特权 级 和 类 型 ， 并 可 能 引发 处 理 右 开 币 中 糊 
TS 


约 临时 体 存 当前 栈 段 寄 人 存货 SS 和 栈 指针 ESP 的 内 容 。 
( 把 新 的 线段 选择 子 和 栈 指 针 代 入 SS 和 ESP 寄存 项， 切换 到 新 


(@) 将 刚才 临时 保存 的 SS 和 ESP 的 内 容 压 入 当前 栈 ， 如 图 14-21 所 





(a) 控制 转移 前 的 旧 栈 (32 位》 (b) 控制 转移 后 的 新 栈 〈32 位 ) 


图 14-21 特权 级 间 控 制 转 移 时 的 栈 切 换 


GO 依据 调用 门 朱 述 符 " 参 数 个 数 "字段 的 指示 ， 从 有 旧 栈 中 将 所 有 参数 
者 复制 到 新 栈 中 。 如 果 参 数 个 数 为 0， 不 复制 参数 ， 如 图 14-21 所 示 。 


(8) 将 当前 段 寄 存 嚣 CS 和 指令 指针 寄存 可 EIP 的 内 容 压 入 新 栈 ， 如 图 
14-21 所 示 。 通 过 调用 门 实施 的 控制 转移 一 定 是 远 转移 ， 所 以 要 压 入 CS 
和 EIP。 


(9) 从 调用 门 摘 述 符 中 依次 将 目标 代码 段 选 择 子 和 段 内 仿 移 传送 到 CS 
和 EIP 寡人 存 左 ， 开 始 执行 被 调用 过 程 。 

相反 ， 如 果 没 有 改变 特权 级 别 ， 则 不 切换 栈 ， 继 续 使 用 调用 者 的 当 
六 栈 ， 只 在 原来 的 基础 上 压 入 当前 段 寄 人 存 右 CS 和 指令 指针 寄存 器 EIP 的 
内 容 ， 如 图 14-22 所 示 。 

再 次 ， 如 果 通 过 调用 门 的 控制 转移 是 使 用 jmop far 指令 发 起 的 ， 结 果 
就 是 肉 包 子 打 狗 ， 有 去 无 回 。 而 且 ， 没有 特权 级 的 变化 ， 也 不 需要 切换 
栈 。 相 反 ， 如 有 果 通 过 调用 门 的 控制 转移 是 使 用 call far 指 令 发 起 的 ， 那 
么 ， 可 以 使 用 远 返 回 指令 retf 把 控制 返回 到 调用 者 。 

从 同一 特权 级 返回 时 ， 处 理 露 将 从 栈 中 弹出 调用 者 的 代码 段 选择 子 
和 指令 指针 。 尽 管 它们 通 间 是 有 效 的 ， 但 是 ， 为 了 安全 起 见 ， 处 理 需 依 
然 会 进行 特权 级 检 和 奏 。 


一 一 调用 前 的 ESP 


一 一 调用 后 的 ESP 





栈 推进 方 回 


图 14-22 ”相同 特权 级 控制 转移 前 后 的 栈 变化 


要 求 特权 级 变化 的 远 返 回 ， 只 能 返回 到 较 低 的 特权 级 别 上 。 控 制 返 
加 的 全 部 过 程 如 下 : 


QD 检查 栈 中 保存 的 CS 寄存 亏 的 内 容 ， 根 据 其 RPL 字段 决定 返 回 时 
是 否 需 要 改变 特权 级 别 。 

@) 从 当前 栈 中 读 取 CS 和 EIP 寄存 器 的 内 容 ， 并 针对 代码 段 描述 符 和 
代码 段 选 择 子 的 RPL 字段 实施 特权 级 检查 。 


(3) 如 朱 远 返回 指令 是 市 参数 的 ， 则 将 参数 和 ESP 寄存 右 的 当前 值 相 
加 ， 以 跳 过 栈 中 的 参数 部 分 。 最 后 的 结果 是 ESP 寄存 需 指 同调 用 者 SS 
和 ESP 的 压 栈 值 。 注 意 ，retf 指令 的 字 节 计数 值 必须 等 于 调用 门 中 的 参 
数 个 数 乘 以 参数 长 度 。 


4) 如 条 返回 时 需要 改变 特权 级 ， 从 栈 中 将 SS 和 ESP 的 压 栈 值 代入 
段 寄 存 器 SS 和 指令 指针 寄存 器 ESP， 切 换 到 调用 者 的 栈 。 在 此 期 间 ， 一 
旦 检 柚 到 有 任何 界限 违例 的 情况 部 将 引 肥 处 理 右 卉 向 中 断 。 


(5) 如 果 远 返回 指令 是 带 参 数 的 ， 则 将 参数 和 ESP 寄存 右 的 当前 值 相 
加 ， 以 跳 过 调用 者 栈 中 的 参数 部 分 。 最 后 的 结果 是 调用 者 的 栈 恢 复 到 平 
衡 位 置 。 

(6) 如 果 返 回 时 需要 改变 特权 级 ， 检 查 DS、ES、FS 和 GS 寄存 器 的 
内 容 ， 根 据 它 们 找到 相应 的 段 描述 符 。 要 是 有 任何 一 个 段 描述 符 的 DPL 
高 于 调用 者 的 特权 级 〈 返 回 后 的 新 CPL) ， 即 ， 在 数值 上 上， 那么 ， 处 理 
器 将 把 数值 0 传送 到 该 段 寄 存 器 。 


段 描述 符 的 DPL< 返 回 后 的 新 CPL 
那么 ， 这 是 为 什么 呢 ? 


特权 级 检 奉 不 是 在 实际 访问 内 存 时 进行 的 ， 而 古 在 将 选择 子 代 入 段 
寄存 旧时 进行 的 。 下 和 面 这 两 条 指令 可 以 非常 清楚 地 说 明 这 一 反 : 


mov ds,ax ;进行 特权 级 检查 
mov edx, [0x2000] ;不 进行 特权 级 检 覃 


要 想 访 问 内 存 中 的 数据 ， 必 须 先 指定 一 个 段 。 即 ， 将 选择 子 代 入 示 
个 段 寄 和 存 禹 。 正 是 因为 如 此 ， 处 理 帮 只 在 将 选择 子 代 入 上 段 寄 存 占 时 进行 
一 次 特权 级 检查 ， 而 在 此 之 后 的 普通 内 存 访问 时 ， 不 进行 特权 级 检 奏 。 
处 理 问 的 意思 十， 只 要 你 能 进入 大 门 ， 束 证 明 你 的 确 古 这 里 的 主人 ， 随 
后 你 干什么 它 都 不 会 干涉 。 


现在 做 一 个 假设 ， 假 设 一 个 3 特权 级 的 应 用 程序 通过 调用 门 请 求 0 特 
权 级 的 操作 系统 服务 。 在 进入 操作 系统 例 程 后 ， 当 前 特权 级 CPL 变 成 0。 
在 该 例 程 和 内， 操作 系统 可 能 会 访问 目 己 的 0 特权 级 数据 段 以 进行 条 些 内 部 
操作 。 妆 然 ， 它 也 必须 先 执行 将 选择 子 代 入 上段 寄存 问 的 操作 : 


mov ds,ax ;操作 系统 目 己 的 选择 子 


按 道理 ， 安 全 的 做 法 是 先 将 旧 的 DS 值 压 栈 ， 用 完 后 再 出 栈 。 像 这 
样 : 


但 是 ， 如 条 操作 系统 例 程 没有 这 么 做 ， 一 定 有 和 它 的 中 理 ， 而 处 理 规 
也 无 权 干 水。 唯一 可 以 预料 的 是 ， 当 控制 返回 到 应 用 程序 时 ， 段 寄存 苍 
DS 依然 指 回 操 作 系 统 数 据 段 。 因 此 ， 应 用 程序 就 可 以 直接 在 3 特权 级 下 
访问 操作 系统 的 数据 段 : 





mo edx,; LUX0OU0C| 


这 是 因为 ， 特 权 级 检查 只 在 引用 一 个 段 的 时 候 进 行 。 即 ， 只 在 将 选 
择 子 传送 到 上 段 寄 存 器 的 时 候 进 行 。 只 要 通过 了 这 一 天， 后 面 那 些 使 用 这 
个 段 寄 存 器 的 内 存 访问 就 都 是 合法 的 。 

为 了 解决 这 个 问题 ， 在 执行 retf 指令 时 ， 要 检查 数据 段 寄存 占 ， 根 据 
它们 找到 相应 的 段 摘 述 符 。 要 是 有 任何 一 个 段 摘 述 符 的 DPL 高 于 调用 者 
的 特权 级 《返回 后 的 新 CPL) ， 那 么 ， 处 理 器 将 把 数值 0 传送 到 该 段 寄 存 
五 。 使 用 这 样 的 段 寄 存 亏 访问 内 存 ， 会 引 肥 处 理 右 天 第 中 断 。 

特别 需要 注意 的 是 ， 任 务 状 态 段 (TSS) 中 的 SS0、ESP0、SS1、 
ESP1、SS2、ESP2 域 是 静态 的 ， 除 非 软 件 进行 修改 ， 人 个 则 处 理 左 从 来 
不 会 改变 它们 。 举 个 例子 ， 当 处 理 器 通过 调用 门 进入 0 特权 级 的 代码 段 
时 ， 会 切换 到 0 特权 级 栈 。 返 回 时 ， 并 不 把 0 特权 级 栈 指针 的 内 容 更 新 到 
TSS 中 的 ESP0 域 。 下 次 再 次 通过 调用 门 进 入 0 特权 级 代码 段 时 ， 使 用 
的 依然 是 ESP0 的 静态 值 ， 从 来 不 会 改变 。 这 就 是 说 ， 如 果 你 希望 通过 0 


特权 级 栈 返回 数据 ， 融 必须 目 己 来 做 这 件 事 ， 比 如 ， 在 返回 到 低 特权 级 
列 的 代码 段 之 前 ， 手 工 改 写 TSS 中 的 ESP0 域 。 


14.5.2 ”进入 3 特权 级 的 用 户 程 序 的 执行 


接着 回 到 代码 清单 14-1 中 。 


任务 寄存 需 TR 总 是 指 问 当前 任务 的 任务 状态 段 (TSS) ， 而 LDTR 
寄存 器 也 总 是 指向 当前 任务 的 LDT。TSS 是 任务 的 主要 标志 ， 因 此 要 使 
TR 寄存 器 指 同 任务 ， 而 使 用 LDTR 的 原因 是 可 以 在 任务 执行 期 间 加 速 段 
的 访问 。 

在 多 任务 环境 中 ， 随 着 任务 的 切换 ， 每 当 一 个 任务 开始 运行 时 (成 
为 前 台 活 动 任 务 ) ，TR 和 LDT 寄存 器 的 内 容 都 会 更 新 ， 以 指 癌 新 的 当前 
任务 。 

现在 的 问题 是 ， 我 们 只 有 一 个 任务 ， 而 且 是 个 3 特权 级 的 任务 ， 不 能 
用 任务 切换 的 方法 使 它 开 始 运 行 。 这 个 问题 可 以 表述 为 : 如 何 从 任务 的 0 
特权 级 全 局 空间 转移 到 它 自己 的 3 特权 级 空间 正常 执行 ? 

答案 是 先 确立 身份 ， 即 ， 使 TR 和 LDTR 寄存 器 指向 这 个 任务 ， 然 后 
假装 从 调用 门 返 回 。 和 当前 任务 有 关 的 信息 都 在 它 的 任务 控制 块 
(TCB) 中 。 因 此 ， 第 832、833 行 ， 先 令 段 寄存 器 DS 指向 4GB 的 内 存 
段 。 

第 851、852 行 ， 加 和 载 任 务 天 和 存 右 TR 和 局 部 摘 述 符 表 寄存 凯 
(LDTR) 。 

如 图 14-23 所 示 ，TR 和 LDTR 寄存 右 都 包括 16 位 的 选择 需 部 分 ， 以 
及 的 搬 述 符 高 速 绥 存 器 部 分 。 选 择 器 部 分 的 内 容 是 TR 和 LDT 描述 符 的 选 
择 子 ; 摘 述 符 高 速 绥 存 噩 部 分 的 内 容 则 指 癌 当前 任务 的 TSS 和 LDT， 以 
加 速 这 两 个 段 〈 表 ) 的 访问 。 





下 ET 
| 选择 器 一 | |< 一 一 一 一 一 描述 符 高 速 缓存 器 一 一 一 一 一 一 >| 


图 14-23 LDTR 和 TR 寄存 器 
加 载 任务 寄存 器 TR 需要 使 用 ltr 指令 。 这 条 指令 的 格式 为 
LEE Amle 


这 条 指令 的 操作 数 可 以 是 16 位 通用 寄存 器 ， 也 可 以 是 指 问 一 个 16 位 
单元 的 内 存 地 址 。 但 不 管 是 寄存 器 还 是 内 存单 元 ， 其 内 容 都 是 16 位 的 
TSS 选择 子 。 

在 将 TSS 选择 子 加 载 到 TR 寄存 右 之 后 ， 处 理 占 用 该 选择 子 访问 
GDT 中 对 应 的 TSS 摘 述 符 ， 将 段 界 限 和 段 基 地 址 加 载 到 任务 寄存 右 TR 
的 描述 符 高 速 缓存 器 部 分 。 同 时 ， 处 理 器 将 该 TSS 描述 符 中 的 B 位 置 
“1”， 也 就 是 标志 为 “ 忙 ”， 但 并 不 执行 任务 切换 。 

该 指令 不 影响 EFLAGS 寄存 如 的 任何 标志 位 ， 但 属于 只 能 在 0 特权 
级 下 执行 的 特权 指令 。 

加 载 局 部 描述 符 表 寄存 器 (LDTR) 使 用 的 是 lldt 指令 ， 其 格式 和 |tr 
是 一 样 的 : 





Jict VTS 


其 操作 数 也 和 Itr 指令 一 样 ， 但 是 ， 指 回 的 是 16 位 LDT 选择 子 。ltr 和 
lldt 指令 执行 时 ， 处 理 器 首先 要 检查 描述 符 的 有 效 性 ， 包 括 审查 它 是 不 是 
TSS 或 者 LDT 摘 述 符 。 在 将 LDT 选择 子 加 载 到 LDTR 等 存 絮 之后， 处 理 
器 用 该 选择 子 访问 GDT 中 对 应 的 LDT 描述 符 ， 将 段 界限 和 上 段 基 地 址 加 载 
到 LDTR 的 描述 符 高 速 缓存 器 部 分 。CS、SS、DS、ES、FS 和 GS 寄存 
器 的 当前 内 容 不 受 该 指令 的 影响 ， 包 括 TSS 中 的 LDT 选择 子 字 段 。 

如 果 执 行 这 条 指令 时 ， 代 入 LTR 选择 器 的 选择 子 ， 其 高 14 位 是 全 
零 ，LDTR 寄存 右 的 内 容 补 标记 为 无 效 ， 而 该 指令 的 执行 也 将 不 声 不 啊 
地 结束 〈( 即 不 会 引发 异常 中 断 )。 当 然 ， 后 续 那 些 引 用 LDT 的 指令 都 将 
引发 处 理 絮 异常 中 断 (对 摘 述 符 进 行 校 验 的 指令 除外 ) ， 例 如 ， 将 一 个 
指 同 LDT 的 段 选 择 子 代入 段 守 存 器 。 

最 后 ， 如 图 14-24 所 示 ， 这 是 一 个 任务 的 全 景 图 ， 给 出 了 与 一 个 任务 
相关 的 各 个 组 成 部 分 。 
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图 14-24 ”与 任务 相关 的 各 部 分 逻辑 关系 示 音 图 


注意 了 ， 现 在 ， 局 部 搞 述 符 表 《〈LDT) 已 经 生效 ， 可 以 通过 它 访问 
用 户 程序 的 私有 和 内存 段 了 。 


第 854、855 行 ， 访 问 任务 的 TCB， 从 中 取出 用 户 程 序 头 部 段 选择 
子 ， 并 传送 到 段 寄 存 器 DS。 该 选择 子 RPL 字段 的 值 为 ?3， 即 ， 请 求 特权 
级 为 3; TI 位 是 “1”， 指 向 任务 自己 的 LDT。 这 两 条 指令 执行 后 ， 段 寄存 器 
DS 了 吏 指 同 用 户 程序 头 部 段 。 

第 858 一 862 行 ， 从 用 户 程 序 尖 部 内 取出 栈 段 选择 子 和 栈 指 针 ， 以 及 
代码 段 选 择 子 和 入 口 点 ， 并 将 它们 顺序 压 入 当前 的 0 特权 级 栈 中 。 这 部 分 
内 容 要 结合 第 13 章 的 用 户 程 序 尖 部 来 分 析 (代码 清单 13-3) 。 

第 864 行 ， 执 行 一 个 远 返 回 指令 retf， 假 装 从 调用 门 返 回 。 于 是 控制 
转移 到 用 户 程 序 的 3 特权 级 代码 开始 执行 。 注 意 ， 这 里 所 用 的 0 特权 级 栈 
并 非 是 来 自 于 TSS。 不 过 ， 处 理 器 不 会 在 意 这 个 。 下 次 ， 从 3 特权 级 的 段 
再 次 来 到 0 特权 级 执行 时 ， 束 会 用 到 TSS 中 的 0 特权 级 栈 了 。 

现在 回 到 上 一 和 章 ， 看 代码 清单 13-3。 

用 户 程序 现在 是 工作 在 它 的 局 部 空间 里 。 它 可 以 通过 调用 门 请 求 系 
统 服务 来 显示 字符 串 ， 或 者 读 取 硬盘 数据 ， 这 都 没有 问题 。 这 些 指令 可 
以 再 次 加 深 我 们 对 调用 门 的 理解 ， 请 旋 者 日 行 分 析 。 


唯一 的 问题 是 ， 当 它 最 后 用 jmp far 指令 将 控制 权 返 回 到 内 核 时 ， 可 
能 行 不 通 了 。 这 条 指令 是 


-mp far [EscTerninaEsErooramj] ;将 控制 权 返 回 到 系统 


这 确实 是 一 个 调用 门 。 而 且 ， 通 过 jmp far 指令 使 用 调用 门 也 没有 任 
何 问 题 。 问 题 在 于 ， 当 控制 转移 到 内 核 时 ， 当 前 特权 级 没有 变化 ， 还 是 
3， 因 为 使 用 mp far 指令 通过 调用 门 转移 控制 是 不 会 改变 当前 特权 级 别 
的 。 


册 回 到 本 章 ， 看 代码 清和 后 14-1。 


返回 反 古 在 第 866 行 。 因 为 当前 特权 级 是 3， 以 这 样 低 的 特权 级 别 来 
执行 第 867、868 行 的 指令 ， 一 定 会 引 及 处 理 右 开关 中 断 : 


mov eax/cCcore data seg sel 


mov ds,eax 


在 这 里 ， 当 前 特权 级 CPL 为 3， 选 择 子 core_data_seg_sel 的 请 求 特 
权 级 RPL 为 0， 目 标 代 码 段 的 特权 级 DPL 为 0， 因 为 当前 特权 级 CPL 低 于 
目标 代码 段 的 DPL， 就 算 请 求 特权 级 RPL 和 目标 代码 段 的 DPL 相同 ， 也 
不 可 能 通过 特权 级 检查 。 


异 遇 和 卉 和 帝 中 断 的 处 理 将 在 第 17 革 讲 述 ， 我 们 现在 还 没有 任何 接 官 
和 处 理 异 利 中 断 的 机 制 ， 所 以 ， 这 个 异 第 可 能 不 会 明显 地 被 你 观察 到 。 


还 需要 特别 提醒 的 是 ， 进 入 3 特权 级 的 用 户 程 序 局 部 空间 时 ， 任 务 的 
IO 特权 级 IOPL 是 0， 任 务 没 有 I/O 操作 的 特权 。 


最 后 ， 将 本 章 的 源 代 码 编 诺 ， 并 从 第 1 个 远 辑 司 区 开始 ， 将 编 详 后 的 
文件 写 入 虚拟 便 熏 。 如 各 你 用 的 虚拟 便 盘 文件 还 是 第 13 重用 过 的 那个 ， 
这 驶 是 唯一 要 做 的 工作 ; 否则， 还 要 与 入 第 13 草 的 主 引 寻 程序 、 用 户 程 
序 和 数据 文件 。 具 体 方法 参见 上 一 草 。 最 后 ， 局 动 虚拟 机 ， 应 该 能 观察 
到 如 图 14-25 所 示 的 画面 。 
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图 14-25 ”本 章程 序 的 运行 结果 
14.5.3 ”检查 调用 者 的 请 求 特 权 级 RPL 


在 本 和 草 的 最 后 ， 我 们 回 过 头 来 聊 一 聊 与 请 求 特 权 级 RPL 有 关 的 问 
题 。 通 过 这 个 话题 的 深入 ， 你 会 更 进一步 了 解 处 理 桌 引入 RPL 的 原因 和 

为 了 访问 一 个 段 ， 自 先 需 要 将 段 选 择 子 代入 段 寄 存 帮 ， 这 也 是 处 理 
研 进 行 特 权 级 检查 的 大 好 机 会 : 








mov TS CX 


在 绝 大 多 数 情况 下 ， 请 求 访 问 一 个 段 的 程序 也 是 段 选 择 子 的 提供 
者 。 台 是 说 ， 当 前 特权 级 和 请 求 特 权 级 是 相同 的 ， 即 ，RPL 三 CPL。 

一 般 来 说 ， 用 户 程序 的 特权 级 别 很 低 ， 而 且 不 能 执行 JO 操作 。 假 设 
操作 系统 提供 了 一 个 例 程 ， 可 以 从 用 户 程序 那里 接受 三 个 参数 : 逻辑 局 
区 号 、 数 据 段 选择 子 和 上段 内 偏 移 量 ， 人 然后 读 硬盘 ， 并 把 数据 传送 到 用 户 
程序 的 缓冲 区 内 。 为 了 使 用 户 程 序 可 以 调用 此 例 程 ， 操 作 系 统 把 它 定 义 
成 调用 门 。 

一 般 来 说 ， 用 户 程 序 会 提供 一 个 RPL 为 3 的 段 选择 子 给 操作 系统 例 
程 。 通 过 调用 门 实施 控制 转移 后 ， 当 前 特权 级 CPL 变 成 0， 实 际 的 请 求 者 
是 用 户 程 序 ， 选 择 子 的 请 求 特 权 级 RPL 为 3， 要 访问 的 段 属于 用 户 程序 ， 
其 描述 符 的 DPL 为 3， 在 数值 上 符合 CPL<DPL， 并 有 日 RPL<DPL 的 条 
件 ， 可 以 正常 执行 。 


人 类 的 可 悉 之 处 无 扎 不 入 ， 总 爱 销 空子 。 想 象 一 下 ， 用 户 程序 的 纺 
写 者 通过 钴 研 ， 知 道 了 内 核 数 据 段 的 选择 子 ， 而 且 布 望 用 这 个 选择 子 访 
问 内 核 数 据 段 。 当 然 ， 他 不 可 能 在 用 户 程 序 里 访问 内 核 数 据 段 ， 因 为 那 
个 数据 段 的 DPL 为 0， 而 用 户 程序 工作 时 的 当前 特权 级 为 93， 处 理 硕 会 很 
机 殴 地 把 来 访 者 拒 之 门 外 。 


但 是 ， 他 可 以 借助 于 刚才 那个 调用 门 。 特 别 是 ， 他 提供 的 是 一 个 
RPL 为 0 的 选择 子 ， 而 且 该 选择 子 指 回 操作 系统 的 段 摘 述 符 。 此 时 ， 当 
前 特权 级 CPL 为 0， 请 求 特权 级 RPL 为 0， 目 标 数据 段 描述 符 的 DPL 为 
0， 同 样 符合 在 数值 上 符合 CPL<sDPL， 并 且 RPL<DPL 的 条 件 ， 并 且 人 允许 
器 内 核 数 据 段 写 入 忆 区 数据 ， 他 得 膛 了 ! 

我 知道 ， 有 人 会 说 ， 通 过 调用 门 进 入 内 核 例 程 时 ， 用 户 程序 的 代码 
段 选 择 子 就 作为 返回 地 址 压 在 栈 中 ， 人 代码 段 选 择 子 的 低 2 位 就 是 用 户 程 序 
的 特权 级 。 因 此 ， 可 以 改造 处 理 嚣 固件， 使 它 能 够 访问 栈 ， 用 这 个 特权 
级 来 进行 特权 级 检查 。 

但 是 ， 有 这 种 认识 的 朋友 们 和 志 了 ， 处 理 占 的 乔 商 很 低 ， 它 不 可 能 知 
道 谁 是 真正 的 请 求 者 。 你 当然 可 以 通过 分 析 程 序 的 行为 来 区 分 它们 ， 但 
处 理 器 不 能 。 因 此 ， 当 指令 





mov Qs -ax 
或 者 

mov dsyex 
执行 时 ，AX 或 者 CX 寄存 右 中 的 选择 子 可 能 是 内 核 目 己 提 供 的 ， 也 可 能 
来 目 于 恶意 的 用 户 程 序 ， 有 是 不 是 合法 ， 这 两 种 情况 要 区 别 对 符 ， 不 能 一 
棍子 打 死 。 所 以 ， 这 已 经 超出 了 处 理 右 的 能 力 和 职权 施 围 。 

怎么 共 ? 

还 记得 在 本 章 的 前 面 ， 在 讨论 RPL 时 ， 我 是 怎么 说 的 ? 我 说 的 是 ， 
RPL 只 是 在 原来 的 基础 上 多 增加 了 一 种 检查 机 制 ， 并 把 如 何 能 够 通过 这 
种 检查 的 目 由 裁量 权 交 给 软件 《的 编写 者 ) 。 

引入 请 求 特权 级 RPL 的 原因 是 处 理 器 在 过 到 一 条 将 选择 子 传送 到 上 段 
寄存 旧 的 指令 时 ， 无 法 区 分 真正 的 请 求 者 古 谁 。 但 是 ，5 引 入 RPL 本 里 并 
不 能 完全 解决 这 个 问题 ， 这 只 是 处 理 器 和 操作 系统 之 间 的 一 种 协议 ， 处 


理 器 负责 检查 请 求 特权 级 RPL， 判 断 它 是 否 有 权 访 问 ， 但 前 提 是 提供 了 
正确 的 RPL; 内 核 或 者 操作 系统 负责 鉴别 请 求 者 的 身份 ， 并 有 义务 保证 
RPL 的 值 和 它 的 请 求 者 身份 相符 ， 因 为 这 是 处 理 喜 无 能 为 力 的 。 


因此 ， 在 引入 RPL 这 件 事 上 ， 处 理 器 的 潜台词 是 ， 仅 依靠 现 有 的 
CPL 和 DPL， 无 法 解决 由 请 求 者 不 同 而 市 来 的 安全 隐患 。 那 么 ， 好 吧 ， 
再 增加 一 道门 卫 ， 但 前 提 是 ， 操 作 系 统 只 将 通行 证 发 放 给 正确 的 人 。 

为 了 帮助 内 核 或 者 操作 系统 核查 请 求 者 的 时 份 ， 并 提供 正确 的 RPL 
值 ， 处 理 器 提供 了 arpl 指令 。arpl 指令 的 作用 是 调整 段 选择 子 RPL 字段 
的 值 (Adjust RPL Field of Segment Selector) ， 其 格式 为 


arpl r/mL6,.£16 


该 指令 比较 两 个 段 选择 子 的 RPL 字段 ， 目 的 操作 数 可 以 是 包含 了 16 
位 段 选择 子 的 通用 寄存 器 ， 或 者 指向 一 个 16 位 单元 的 内 存 地 址 ， 该 字音 
元 里 存放 的 是 段 选择 子 ， 源 操作 数 只 能 是 包含 了 段 选择 子 的 16 位 通用 寄 

该 指令 执行 时 ， 处 理 器 检查 目的 操作 数 的 RPL 字段 ， 如 果 它 在 数值 
上 小 于 源 操作 数 的 RPL 字段 ， 则 设置 ZF 标志 ， 并 增加 目的 操作 数 RPL 
字段 的 值 ， 使 之 和 源 操作 数 RPL 字段 的 值 相同 。 否 则 ，ZF 标志 清 零 ， 而 
且 除 此 之 外 什么 也 不 会 发 生 。 


arpl 古典 型 的 操作 系统 指令 ， 它 退 第 用 于 调整 应 用 程序 传递 给 操作 
系统 的 段 选 择 子 ， 使 其 RPL 字段 的 人 和 应 用 程序 的 特权 级 相 匹 配 。 在 这 
种 情况 下 ， 传 饮 给 操作 系统 的 段 选择 子 是 作为 目的 操作 数 出 现 的 ;而 应 
用 程序 的 段 选择 子 是 作为 源 操作 数 出 现 的 “可 以 从 栈 中 取得 ) 。arpl 也 
可 以 在 应 用 程序 中 使 用 。 


这 样 ， 为 了 防止 恶意 的 数据 访问 ， 操 作 系 统 应 该 从 当前 栈 中 取得 用 
户 程 序 的 代码 段 选 择 子 (调用 者 代码 段 寄 存 器 CS 的 内 容 ) 作为 源 操作 
数 ， 并 把 作为 参数 传递 进来 的 数据 段 选择 子 作 为 目的 操作 数 ， 来 执行 arpl 
指令 ， 把 数据 段 选 择 子 的 请 求 特权 级 RPL 调整 〈 恢 复 ) 到 调用 者 的 特权 
级 别 上 。 

一 旦 调整 了 请 求 特权 级 ， 那 么 ， 当 前 特权 级 CPL 为 0， 请 求 特权 级 
RPL 为 3， 数 据 段 描述 符 特 权 级 DPL 为 0， 数 值 上 并 不 符合 CPL<DPL， 
并 且 RPL<DPL 的 条 件 ， 禁 止 访问 ， 并 引发 处 理 器 异常 中 汤 。 


引入 RPL 检查 机 制 和 arpl 指令 ， 主 要 是 防止 对 段 的 不 安全 访问 ， 不 
党 古 亚 意 的 ， 还 是 因为 编程 芷 漏 而 引起 的 。 不 管 怎么 说 ， 一 且 引 入 了 
RPL 检 奏 机 制 ， 它 惑 会 处 处 起 作用 ， 同 时 也 融 成 了 编写 程序 时 不 得 不 芳 
上 碟 和 艾 普 处 理 的 问题 。 


14.5.4 在 Bochs 中 调试 程序 的 新 方法 


随 独 本 书 内 容 的 深入 ， 程 序 会 越 来 越 复 杂 ， 但 一 般 不 会 出 什么 问 
题 ， 因 为 我 都 调试 好 了 。 当 然 ， 你 可 能 想 在 此 基础 上 做 一 些 改动 ， 实 现 
其 他 一 些 功能 。 在 这 种 情况 下 ， 每 一 次 运行 时 能 得 到 预期 结果 的 可 能 性 
微乎其微 。 不 过 不 用 担心 ， 使 用 本 书 前 面 讲 过 的 调试 技术 ， 你 一 定 能 够 
找到 问题 所 在 。 比 如 ， 你 可 以 使 用 “info gdt 指 令 察 看 GDT 中 的 段 描 述 符 
和 门 描述 符 。 

本 章 中 涉及 到 两 个 新 的 系统 守 存 右 LDTR 和 TR， 要 察看 它们 的 内 
容 ， 可 以 使 用 以 前 讲 过 的 Bochs 调试 指令 “sreg”"; 为 了 察看 局 部 描述 符 表 
LDT 的 所 有 内 容 ， 可 以 使 用 “info ldt*;， 要 察看 任务 状态 段 TSS 的 内 容 ， 
可 以 使 用 “info tss”"。 注 意 ， 显 示 LDT 和 TSS 的 内 容 时 ，Bochs 要 先 从 处 
理 器 的 TR 和 LDTR 寄存 器 获取 基地 址 和 界限 信息 。 因 此 ， 显 示 的 是 当前 
任务 的 LDT 和 TSS。 如 图 14-26 所 示 ， 这 里 显示 了 在 执行 代码 清单 14-1 
的 第 851 行 "ltr [ecx+0x18] 之后， 用 “info tss" 命 令 显 示 的 TSS 状态 。 





fp Bochs for Windows - Console 
Si 二 和 
(oD dololololololololo [ol lolololololololololololon aa < 中 4 虽 下 TI 上 


S:110> n 
Next at t:17860191 
909) [90x9600600060041421] 06038 :90990006600066094a1 (unk. ctxt)]): lLtr word ptr ds:[ecx 
965918 


( 
十 


2> info tss 
sz0x68，base=0x00000000001048e8 ，uUalilid:1 

S Peioioloioliololols 

S ) : 9x002d :0x90000009 
ss:esp(2): Ox003e:0Qx00000000 
cr3: 0x90006000 
eip: QOQxQ0000000 
eflags: QxQQ000000 
cs: 90x00600 ds: 096x0000 ss: 0x0009 
es: 0x0000 fs: 90x0000 gs: 0x0009 
eax: 0x9g90006000 _ ebx: 0x900690006 ecx: 6xo006600066 _ edx: 9x00000060 
esi: 0x90006000 edi: OQx00000000 ebp: Ox00000000 esp: 9x000006060 
ldt: 0x9060 
i/0o map: 0x9o967 
<bochs:113> 


图 14-26 ”用 info tss 命令 显示 TSS 段 的 内 容 








检测 点 14.3 


如 图 14-26， 为 什么 该 任务 的 TSS 中 ， 所 有 段 寄 存 器 和 通用 寄存 器 的 
值 都 是 0 而 不 影 啊 任务 的 执行 ? 


本 章 习 题 


1. 修改 代码 清单 14-1 和 13-3， 使 用 户 程序 能 够 正 背 返回 到 内 核 ， 并 
在 显示 消息 后 停机 。 

2. 修改 代码 清单 14-1 和 13-3， 使 得 通过 调用 门 请 求 读 取 人 硬盘 而 区 的 
服务 时 ， 通 过 栈 传递 参数 。 而 且 ， 传 递 的 参数 分 别 是 逻辑 证 区 与 、 数 据 
段 选 择 子 和 有 段 内 偏 移 。 要 求 使 用 arp|l 指令 。 


第 15 章 ”任务 切换 


从 80286 开始 的 处 理 夫 羡 面 癌 多 任务 系统 而 设计 的 。 在 一 个 多 任务 
的 环境 中 ， 可 以 同时 存在 多 个 任务 ， 每 个 任务 都 有 各 目的 局 部 描述 符 表 
CLDT) 和 任务 状态 段 (TSS〉。 在 局 部 插 述 从 表 中 存放 看 专属 于 任务 局 
部 空间 的 段 的 插 述 从 。 可 以 在 多 个 任务 之 间 切 换 ， 使 它们 轮流 执行 ， 从 
一 个 任务 切换 到 万 一 个 任务 时 ， 共 体 的 切换 过 程 是 由 处 理 右 固件 负责 进 


所 谓 多 任务 系统 ， 和 是 指 能 够 同时 执行 两 个 以 上 任务 的 系统 。 即 使 前 
一 个 任务 没有 执行 完 ， 下 一 个 任务 也 可 以 开始 执行 。 但 是， 什么 时 候 切 
换 到 万 一 个 任务 ， 以 及 切换 到 哪 一 个 任务 执行 ， 主 要 是 操作 系统 的 贡 
任 ， 处 理 亏 只 负责 有 具体 的 切换 过 程 ， 包 括 傈 护 前 一 个 任务 的 现场 。 


有 两 种 基本 的 任务 切换 方式 ， 一 种 是 协同 去 的 ， 从 一 个 任务 切换 到 
万 一 个 任务 ， 责 要 当前 任务 主动 地 请 求 析 时 放 到 执行 权 ， 或 者 在 通过 调 
用 门 请 求 操作 系统 服务 时 ， 由 操作 系统 “趁机 "将 控制 转移 到 为 一 个 任务 。 
这 种 方式 依赖 于 每 个 任务 的 “日 律 "性 ， 当 一 个 任务 失控 时 ， 其 他 任务 可 能 
得 不 到 执行 的 机 会 。 

为 一 种 是 抢占 式 的 ， 在 这 种 方式 下 ， 可 以 安 冯 一 个 定时 右 中 断 ， 并 
在 中 断 服务 程序 中 实施 任务 切换 。 硬 件 中 断 信 号 总 会 定时 出 现 ， 不 管 处 
理 器 当时 在 做 什么 ， 中 断 都 会 适时 地 发 生 ， 而 任务 切换 也 就 能 够 顺利 进 
行 。 在 这 种 情况 下 ， 每 个 任务 部 能 获得 平等 的 执行 机 会 。 而 且 ， 即 使 一 
个 任务 失控 ， 也 不 会 导致 其 他 任务 没有 机 会 执行 。 

抢 后 云 多 任务 将 在 第 17 章 讲解 ， 本 章 先 介绍 多 任务 任务 切换 的 一 般 
工作 原理 ， 竺 握 任务 切换 的 几 种 方法 ， 以 及 它们 各 目的 特 所 。 


15.1 本 章 代 码 清 单 





15.2 任务 切换 前 的 设置 


在 上 一 草 里 ， 有 关 特 权 级 间 的 控制 转移 落 图 较 多 ， 容 易 便 读者 混 请 
了 它 和 任务 切换 之 间 的 区 别 。 如 图 15-1 所 示 ， 所 有 任务 共享 一 个 全 局 空 
间 ， 这 是 内 核 或 者 操作 系统 提供 的 ， 包 售 了 系统 服务 程序 和 数据 ;， 同 
时 ， 每 个 任务 还 有 目 己 的 局 部 空间 ， 每 个 任务 的 功能 部 不 一 样 ， 所 以 ， 
局 部 空间 包含 的 古 一 个 任务 区 别 于 其 他 任务 的 私有 代 人 码 和 数据 。 


图 15-1 任务 切换 和 任务 内 特权 级 间 的 控制 转移 





在 一 个 任务 内 ， 全 局 空间 和 局 部 空间 具有 不 同 的 特权 级 别 。 使 用 
门 ， 可 以 在 任务 内 将 控制 从 3 特权 级 的 局 部 空间 转移 到 0 特权 级 的 全 局 空 
间 ， 以 使 用 内 核 或 者 操作 系统 提供 的 服务 。 


任务 切换 是 以 任务 为 单位 的 ， 是 指 离开 一 个 任务 ， 转 到 万 一 个 任务 
中 去 执行 。 任 务 园 移 相对 来 说 要 复杂 得 多 ， 当 一 个 任务 正在 执行 时 ， 处 
理 亏 的 各 个 部 分 都 和 该 任务 恩 恩 相关 : 上 段 寄 和 存 莫 指 同 该 任务 所 使 用 的 内 
存 段 ; 通用 寄存 礁 保 存 大 该 任务 的 中 间 结 素 ， 等 等 。 离 开 当 前 任务 ， 转 
到 另 一 个 任务 开始 执行 时 ， 要 保存 旧 任务 的 各 种 状态 ， 并 恢复 新 任务 的 
运行 环境 。 

这 就 是 说 ， 要 执行 任务 切换 ， 系 统 中 必须 人 至少 有 两 个 任务 ， 而 且 已 
夭 有 全 修正 储 措 行 册 证 上 二 全 时 中 我们 已 纤 囊 建 过 主人 任务 5 于 个 任 
务 的 特权 级 别 是 3， 即 最 低 的 特权 级 别 。 一 开始 ， 处 理 融 是 在 任务 的 全 局 
空间 执行 的 ， 当 前 特权 级 别 是 0， 然 后 ， 我 们 通过 一 个 虚假 的 调用 门 返 
器， 使 处 理 右 回 到 任务 的 局 部 空间 执行 ， 当 前 特权 级 别 降 为 3。 


事实 上 ， 这 是 没有 必要 的 ， 这 样 做 很 别扭 。 痛 完 ， 处 理 帮 在 刚 进 入 
保护 模式 时 ， 是 以 0 特权 级 别 运行 的 ， 而 且 执 行 的 一 般 是 操作 系统 代码 ， 
也 必须 是 0 特权 级 列 的 ， 这 样 才能 方便 地 控制 整个 计算 机 。 其 次 ， 任 务 并 
不 一 定 非 得 是 3 特权 级 别 的 ， 也 可 以 是 0 特权 级 列 的 。 特 列 是 ， 操 作 系 统 
除 了 为 每 一 个 任务 提供 服务 外 ， 也 会 有 一 个 作为 任务 而 独立 存在 的 部 
分 ， 而 且 是 0 特权 级 列 的 任务 ， 以 完成 一 些 官 理 和 控制 功能 ， 比 如 提供 一 
个 界面 和 用 户 进 行 区 互 。 

既然 是 这 样 ， 当 计算 机 加 电 之 后 ， 一 旦 进入 你 护 模 式 ， 束 了 且 接 创建 
和 执行 操作 系统 的 0 特权 级 任务 ， 这 既 目 然 ， 也 很 方便 。 然 后 ， 可 以 从 该 
任务 切换 到 其 他 任务 ， 不 管 它 们 是 哪个 特权 级 别 的 。 


既然 如 此 ， 我 们 在 这 一 章 里 束 要 上 自 完 创建 0 特权 级 列 的 操作 系统 内 
核 ) 任务 。 

本 章 同 样 没 有 主 引 叶 程 序 ， 还 要 使 用 第 13 章 的 主 引 导 程 序 ， 内 核 音 
分 有 一些 改动 ， 增 加 了 和 任务 切换 有 关 的 代码 。 

现在 来 看 代码 清单 15-1。 

内 核 的 入 口 点 在 第 848 行 ， 第 906 行 之 前 的 工作 都 和 上 一 章 相同 ， 
主要 是 显示 处 理 占 品牌 信息 ， 以 及 安 羔 供 每 个 任务 使 用 的 调用 门 。 

接 下 来 的 工作 是 创建 0 特权 级 的 内 核 任务 ， 并 将 当前 正在 执行 的 内 核 
代 人 码 段 划 归 放 任 务 。 妆 前 代码 的 作用 是 创建 其 他 任务 ， 官 理 它们 ， 所 以 
称 做 任务 宦 理 侨 ， 或 者 叫 程序 官 理 首 。 


任务 状态 段 (TSS) 是 一 个 任务 存在 的 标志 ， 没 有 它 ， 融 无 法 执行 
任务 切换 ， 因 为 任务 切换 时 需要 保存 旧 任 务 的 各 种 状态 数据 。 第 909 一 
911 行 用 于 申请 创建 TSS 所 需 的 内 存 。 为 了 仍 踪 程序 管理 器 的 TSS， 需 
要 保存 它 的 基地 址 和 选择 子 ， 保 存 的 位 置 是 内 核 数 据 段 。 第 431 行 ， 声 
明 并 初始 化 了 6 字 节 的 空间 ， 前 32 位 用 于 保存 TSS 的 基地 址 ， 后 16 位 则 
是 它 的 选择 子 。 

接 肴 ， 第 914 一 918 行 对 TSS 进行 最 基本 的 设置 。 程 序 管 理 帮 任务 没 
有 自己 的 LDT， 任 务 可 以 没有 自己 的 LDT， 这 是 允许 的 。 程 序 管理 器 可 以 
将 自己 所 使 用 的 段 描 述 符 安装 在 GDT 中 。 另 外 ， 程 序 管理 器 任务 是 运行 
在 0 特权 级 别 上 的 ， 不 需要 创建 额外 的 栈 。 因 为 除了 从 门 返回 外 ， 不 能 将 
控制 从 高 特权 级 的 代码 段 转移 到 低 特权 级 的 代 但 段 。 


第 923 一 928 行 ， 在 GDT 中 创建 TSS 的 描述 符 。 必 须 创 建 TSS 的 描 
述 符 ， 而 且 只 能 安装 在 GDT 中 。 

为 了 表明 当前 正在 任务 中 执行 ， 所 要 做 的 最 后 一 个 工作 是 将 当前 任 
务 的 TSS 选择 子 传送 到 任务 寄存 器 TR 中 。 第 932 行 正 是 用 来 完成 这 个 工 
作 的 。 执 行 这 条 指令 后 ， 处 理 器 用 该 选择 子 访问 GDT， 找 到 相对 应 的 
TSS 描述 符 ， 将 其 B 位 置 “1”， 表 示 该 任务 正在 执行 中 (或 者 处 于 挂 起 状 
态 ) 。 同 时 ， 还 要 将 该 描述 符 传 送 到 TR 寄存 器 的 摘 述 和 从 高 速 缓存 器 中 。 

第 935、936 行 ， 任 务 官 理 妖 显 示 一 条 信息 : 


[PROGRAM MANAGER]: Hello! I am Program Manager,run at CPL=0.Now,create 


User task nd switeh to 1t by Lhe CALbE 1NStLEUCtUION,.... 


信息 文本 位 于 内 核 数 据 段 中 ， 代 人 码 清 单 的 第 434 行 声明 了 标号 
prgman_msg1， 并 初始 化 了 以 上 的 字符 串 。 本 章 后 面 还 有 其 他 一 些 字 符 
串 ， 也 是 在 内 核 数 据 段 声明 和 初始 化 的 ， 不 再 闹 述 。 


方 插 号 中 显示 了 信息 的 来 产 ， 是 程序 管理 器 。 后 面 屠 段 话 的 意思 是 
“你 好 ! 我 是 程序 管理 器 ， 运 行 在 0 特权 级 上 。 现 在 ， 我 要 创建 并 通过 
CALL 指令 切换 到 用 户 任 务 ......”。 

让 任务 之 间 对 话 ， 这 是 本 章 的 特点 ， 有 助 于 更 好 地 理解 任务 切换 过 
程 。 既 然 要 创建 另外 的 任务 ， 并 执行 任务 切换 ， 我 们 融 来 看 看 实际 上 是 
怎么 做 到 的 。 


15.3 ”任务 切换 的 方法 


对 多 任务 的 文 持 是 现代 处 理 规 的 标志 之 一 。 为 此 ，Intel 处 理 硕 近 供 
了 多 种 方法 ， 以 灵活 地 在 各 个 任务 之 间 实 施 切 换 。 


尺 害 如 此 ， 处 理 占 并 没有 提供 额外 的 指令 用 于 任务 切换 。 事 实 上 ， 
用 的 部 十 我 们 熟悉 的 老 指 令 和 老手 段 ， 但 是 扩展 了 它们 的 功能 ， 使 之 除 
了 能 够 继续 执行 原 有 的 功能 外 ， 也 能 用 于 实施 任务 切换 操作 。 


第 一 种 任务 切换 的 方法 旦 信 助 于 中 断 ， 这 也 是 现代 抢 丘 却 多 任务 的 
基础 。 原 因 很 蚀 竺 ， 只 要 中 断 没 有 被 屏蔽 ， 它 就 能 随时 友 生 。 特 别 是 害 
时 愉 中 汤 ， 能 够 以 准确 的 时 间 间 隔 友 生 ， 可 以 用 来 强制 实施 任务 切换 。 
毕竟 ,没有 哪个 任务 愿意 交 出 处 理 右 控制 权 ， 也 没有 哪个 任务 能 精确 地 
把 握 交 出 控制 权 的 时 机 。 


我 们 知道 ， 在 实 模 式 下 ， 内 存 最 低地 址 并 的 1KB 十 中 断 问 量 表 ， 傈 
存 着 256 个 中 断 处 理 过 程 的 段 地 址 和 偏 移 地 址 。 当 中 断 发 生 时 ， 处 理 器 
把 中 断气 乘 以 4， 作 为 表 内 索引 号 访问 中 断 癌 量 表 ， 从 相应 的 位 置 取出 中 
汤 处 理 过 程 的 段 地 址 和 偏 移 地 址 ， 并 转移 到 那里 执行 。 


在 保护 模式 下 ， 中 断 癌 量 表 不 再 使 有 用， 取而代之 的 ， 是 中 断 摘 述 符 
表 。 不 要 害怕 ， 它 和 GDT、LDT 是 一 样 的 ， 用 于 保存 描述 符 。 唯 一 不 同 
的 地 方 是 ， 它 保存 的 是 门 描述 符 ， 包 括 中 断 门 、 陷 阱 门 和 任务 门 。 如 果 
你 觉得 这 些 术 语 太 过 于 防 生 ， 那 束 回 忆 一 下 调用 门 ， 这 些 门 和 调用 门 是 
非常 类 似 的 。 当 中 断 发 生 时 ， 处 理 器 用 中 断 号 乘 以 8〈 因 为 每 个 描述 符 占 
8 字 节 )〉) ， 作 为 索引 访问 中 断 描 述 符 表 ， 取 出 门 摘 述 符 。 门 描述 符 中 有 中 
汤 处 理 过 程 的 代码 7 段 选择 子 和 上 段 内 偏 移 量 ， 这 和 调用 门 是 一 样 的 。 接 
着 ， 转 移 到 相应 的 位 置 去 执行 。 


一 般 的 中 断 处 理 可 以 使 用 中 断 门 和 陷阱 门 。 回 忆 一 下 调用 门 的 工作 
原理 ， 它 只 是 从 任务 的 局 部 空间 转移 到 更 高 特权 级 的 全 局 空间 云 执行 ， 
本 质 上 和 是 一 种 任务 内 的 控制 转移 行为 。 导 此 相同 ， 中 断 门 和 陷阱 门人 允许 
在 任务 内 实施 中 断 处 理 ， 转 到 全 局 空间 去 执行 一 些 系统 级 的 管理 工作 ， 
本 质 上 ， 也 古 任 务 内 的 控制 转移 行为 。 


但 是 ， 在 中 断 发 生 时 ， 如 果 该 中断 号 对 应 的 门 是 任务 门 ， 那 么 ， 性 
质 葡 截然 不 同 了 ， 儿 须 进 行 任务 切换 。 即 ， 要 中 断 当 前 任务 的 执行 ， 剑 


护 当 前 任务 的 现场 ， 并 转换 a 到 为 一 个 任务 去 执行 。 


如 图 15-2 所 示 ， 这 是 任务 门 ‘Task-Gate) 描述 符 的 格式 。 从 图 中 可 
见 ， 相 对 于 其 他 各 种 描述 符 ， 任 务 门 描述 符 中 的 多 数 区 域 没 有 使 用 ， 上 所 
以 显得 特别 简单 。 

任务 门 描述 符 中 的 主要 成 份 是 任务 的 TSS 选择 子 。 任 务 门 用 于 在 中 
断 发 生 时 执行 任务 切换 ， 而 执行 任务 切换 时 必须 找到 新 任务 的 任务 状态 
段 (TSS) 。 所 以 ， 任 务 门 应 当 指 回 任 务 的 TSS。 为 了 指 同 任务 的 TSS， 
只 需要 在 任务 门 描述 符 中 给 出 任务 的 TSS 选择 子 就 可 以 了 。 

任务 门 描述 符 中 的 P 位 指示 该 门 是 否 有 效 ， 当 P 位 为 “0 时 ， 不 允许 
通过 此 门 实施 任务 切换 ;，DPL 是 任务 门 描述 符 的 特权 级 ， 但 是 对 因 中 断 
而 发 起 的 任务 切换 不 起 作用 ， 处 理 器 不 按 特权 级 施加 任何 保护 。 但 是 ， 
这 并 不 意味 着 DPL 字段 没有 用 处 ， 当 以 非 中 断 的 方式 通过 任务 门 实施 任 
务 切 换 时 ， 它 承 有 用 了 ， 关 于 这 一 点 ， 你 马上 束 会 看 到 。 
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(不 使 用 ) 





图 15-2 ”任务 门 描述 符 的 格式 


这 样 ， 当 中 断 发 生 时 ， 处 理 器 用 中 断 号 乘 以 8 作为 索引 访问 中 断 描 述 
符 表 。 当 它 发 现 这 是 一 个 任务 门 〈 描 述 符 ) 时 ， 就 知道 应 当 发 起 任务 切 
换 。 于 是 ， 它 取出 任务 门 描述 符 ; 再 从 任务 门 描述 符 中 取出 新 任务 的 
TSS 选择 子 ;， 接着 ， 再 用 TSS 选择 子 访问 GDT， 取 出 新 任务 的 TSS 摘 述 
伯 。 在 转 到 新 任务 执行 前 ， 处 理 器 要 先 把 当前 任务 的 状态 保存 起 来 。 当 
前 任务 的 TSS 是 由 任务 寄存 器 TR 的 当前 内 容 指 同 的 ， 所 以 ， 处 理 器 把 每 
个 寄存 器 的 "快照 ?保存 到 由 TR 指 癌 的 TSS 中 。 然 后 ， 处 理 器 访问 新 任务 
的 TSS， 从 中 恢复 各 个 寄存 需 的 内 容 ， 包 括 通用 寄存 希 、 标 志 寄 存 髓 
EFLAGS、 段 寄存 堪 、 指 令 指 针 寄 存 器 EIP、 栈 指针 寄存 郝 ESP， 以 及 局 
部 描述 符 表 寄存 器 (CLDTR ) 等。 最终， 任务 寄存 器 TR 指 癌 新 任务 的 
TSS， 而 处 理 器 旋即 开始 执行 新 的 任务 。 一 旦 新 任务 开始 执行 ， 处 理 器 
固件 会 自动 将 其 TSS 描述 符 的 B 位 置 “1”， 表 示 该 任务 的 状态 为 忙 。 





当中 断 肥 生 时 ， 可 以 执行 各 规 的 中 断 处 理 过 程 ， 也 可 以 进行 任务 切 
换 。 尽 管 性 质 不 同 ， 但 它们 都 要 使 用 iret 指令 返回 。 前 者 是 返回 到 同一 任 
务 内 的 不 同 代码 段 ， 后 者 是 返回 到 被 中 断 的 那个 任务 。 问 题 是， 处 理 帮 
如 何 区 分 这 两 种 截然 不 同 的 返回 类 型 呢 ? 


如 图 15-3 所 示 ，32 位 处 理 器 的 EFLAGS 有 NT 位 (位 14) ， 意 思 是 
藤 套 任务 标志 (Nested Task Flag) 。 每 个 任务 的 TSS 中 都 有 一 个 任务 
链接 域 〈 指 同 前 一 个 任务 的 指针 ， 参 见 上 一 章 TSS 的 结构 ) ， 可 以 填写 
为 前 一 个 任务 的 TSS 描述 符 选 择 子 。 如 果 当 前 任务 EFLAGS 寄存 器 的 NT 
位 是 “1 人， 则 表示 当前 正在 执行 的 任务 能 套 于 其 他 任务 内 ， 并 且 能 够 通过 
TSS 任务 链接 域 的 指针 返回 到 前 一 个 任务 。 
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图 15-3 标志 寄存 器 EFLAGS 的 NT 位 


因 中 断 而 引 友 任务 切换 时 ， 取 决 于 当前 任务 《〈《 旧 任务 ) 古人 否 众 和 套 于 
其 他 任务 内 ， 其 EFLAGS 寄 存 器 的 NT 位 可 能 是 “0”， 也 可 能 是 “1”。 不 过 
这 无 关 紧 要 ， 因 为 处 理 右 不 会 改变 它 ， 而 是 和 其 他 寄存 带 一 这 ， 写 入 
TSS 中 保护 起 来 。 为 外 ， 妆 前 任务 〈 旧 任务 〉 肯定 处 于 “ 忙 "的 状态 ， 其 
TSS 手 述 符 的 B 位 一 定 是 “人 ， 在 任务 切换 后 同样 保持 不 变 。 


对 新 任务 的 处 理 是 ， 要 把 老 任 务 的 TSS 选择 子 填 写 到 新 任务 TSS 中 
的 任务 链接 域 ， 同 时 ， 将 新 任务 EFLAGS 寄存 器 的 NT 位 置 “1”， 以 允许 
返回 (转换 ) 到 前 一 个 任务 〈 老 任务 ) 继续 执行 。 同 时 ， 还 要 把 新 任务 
TSS 描述 符 的 B 位 置 “1”( 忙 〉。 

可 以 使 用 iret 指令 从 当前 任务 返回 (转换 ) 到 前 一 个 任务 ， 前 提 是 当 
前 任务 EFLAGS 寄存 右 的 NT 位 必须 是 “1”。 无 论 任 何 时 候 处 理 右 人 碾 到 iret 
指令 ， 它 都 要 检查 NT 位 ， 如 果 此 位 是 0， 表 明 是 一 般 的 中 断 过 程 ， 按 一 
般 的 中 断 返 回 处 理 ， 即 ， 中 断 返 回 是 任务 内 的 (中 断 处 理 过程 虽 然 属 于 
操作 系统 ， 但 属于 任务 的 全 局 空间 ) ; 如 果 此 位 是 1， 则 表明 当前 任务 之 
所 以 能 够 正在 执行 ， 是 因为 中 汤 了 别 的 任务 。 因 此 ， 应 当 人 返回 原先 被 中 
断 的 任务 继续 执行 。 此 时 ， 由 处 理 器 固件 把 当前 任务 EFLAGS 寄存 器 的 
NT 位 改 成 "0"， 并 把 TSS 描述 符 的 B 位 改 成 “0”( 非 性 ，。 在 保存 了 当前 
任务 的 状态 之 后 ， 接 着 ， 用 新 任务 〈 被 中 断 的 任务 ) 的 TSS 恢复 现场 。 





除了 因 中 断 引 用 的 任务 切换 之 外 ， 还 可 以 用 远 过 程 调用 指令 CALL， 
或 者 远 跳 转 指 令 JMP 直接 肥 起 任务 切换 。 在 这 两 种 情况 下 ，CALL 和 
JMP 指令 的 操作 数 是 任务 的 TSS 摘 述 符 选 择 子 或 任务 上 门 。 以 下 十 两 个 例 
子 : 


call Ox0010:0x00000000 
jmp Ox0010:0x00000000 


当 处 理 器 执行 这 两 条 指令 时 ， 首 先 用 指令 中 给 出 的 摘 述 符 选 择 子 访 
问 GDT， 分 析 它 的 描述 人 符 类型。 如果 是 一 般 的 代码 段 搬 述 从 ， 束 按 普通 
的 段 间 转移 规则 执行 ， 如 果 是 调用 门 ， 按 调用 门 的 规则 执行 ， 如 果 是 
TSS 描述 符 ， 或 者 任务 门 ， 则 执行 任务 切换 。 此 时 ， 指 令 中 给 出 的 32 位 
偏 移 量 补 忽略， 原因 是 执行 任务 切换 时 ， 所 有 处 理 器 的 状态 都 可 以 从 
TSS 中 获得 。 注 晶 ， 任 务 门 描述 符 可 以 安 疤 在 中 断 摘 述 符 表 中 ， 也 可 以 
安装 在 全 局 描述 符 表 (GDT) 或 者 局 部 描述 符 表 (LDT) 中 。 

如 果 是 用 于 发 起 任务 切换 ，call 指令 和 jmp 指令 也 有 不 同 之 处 。 使 用 
call 指令 发 起 的 任务 切换 类 似 于 因 中 断 发 起 的 任务 切换 。 这 就 是 说 ， 由 
call 指令 发 起 的 任务 切换 是 租 套 的 ， 当 前 任务 〈( 旧 任务 ) TSS 摘 述 符 的 B 
位 保持 原来 的 “1” 不 变 ，EFLAGS 寄存 器 的 NT 位 也 不 发 生变 化 ;新 任务 
TSS 描述 符 的 B 位 置 “1”，EFLAGS 寄存 器 的 NT 位 也 置 “1”， 表 示 此 任务 
敬 套 于 其 他 任务 中 。 同 时 ，TSS 任务 链接 域 的 内 容 改 为 旧 任 务 的 TSS 描 
述 符 选择 子 。 

如 图 15-4 所 示 ， 假 设 任务 1 是 整个 系统 中 的 第 一 个 任务 。 当 任务 1 
开始 执行 时 ， 其 TSS 描述 符 的 B 位 是 “1”，EFLAGS 寄存 器 的 NT 位 是 
“0”， 不 舱 僚 于 其 他 任务 。 

当 从 任务 1 转换 到 任务 2 后 ， 任 务 1 仍然 为 “性 ”，EFLAGS 寄存 器 的 
NT 位 不 变 (在 其 TSS 中 )， ; 任务 2 也 变 为 “ 忙 ”，EFLAGS 寄存 器 的 NT 
位 变 为 “1”， 表 示 髓 套 于 任务 1 中 。 同 时， 任务 1 的 TSS 描述 符 选 择 子 也 
被 复制 到 任务 2 的 TSS 中 《任务 链接 域 ) 。 


任务 切换 任务 切换 








任务 1 的 TSS 任务 2 的 TSS 任务 3 的 TSS 处 理 器 
TSS 描 述 符 B 二 1 TSS 描 述 符 B=1 TSS 描 述 符 B 二 1 


EFLAGS (NT=0) EFLAGS (NT=1) 


EFLAGS (NT=1) 


四 EFLAGS (NT=1) 





一 指向 当前 任务 


图 15-4 ”任务 多 玛 示意 图 


最 后 是 从 任务 2 转换 到 任务 3 执行 。 和 从 前 一 样 ， 任 务 2 保持 “ 忙 ” 的 
状态 ，EFLAGS 寄存 器 的 NT 不 变 (在 其 TSS 中 ) ; 任务 3 成 为 当前 任 
务 ， 其 TSS 描述 符 的 B 位 变 成 “1”( 忙 ，，EFLAGS 寄存 器 的 NT 位 也 变 
成 “1”， 同 时 ， 其 TSS 的 任务 链接 域 指 问 任 务 2。 

用 CALL 指令 发 起 的 任务 切换 ， 可 以 通过 iret 指令 返回 到 前 一 个 任 
务 。 此 时 ， 旧 任务 TSS 摘 述 符 的 B 位 ， 以 及 EFLAGS 寄存 器 的 NT 位 都 
恢复 到 “0”。 


和 call 指令 不 同 ， 使 用 jmp 指令 发 起 的 任务 切换 ， 不 会 形成 任务 之 间 
的 般 套 关系 。 执 行 任务 切换 时 ， 当 前 任务 〈 旧 任务 ) TSS 摘 述 符 的 B 位 
清 零 ， 变 为 非 忙 状态 ，EFLAGS 寄存 器 的 NT 位 不 变 ; 新 任务 TSS 描述 
符 的 B 位 置 1”， 进 入 忙 的 状态 ，EFLAGS 寄存 器 的 NT 位 保持 从 TSS 中 
加 载 时 的 状态 不 变 。 

任务 是 不 可 重 入 的 。 

任务 不 可 重 入 的 本 质 是 ， 执 行 任务 切换 时 ， 新 任务 的 状态 不 能 为 
忙 。 这 里 有 两 个 典型 的 情形 : 

第 一 种 情形 ， 执 行 任务 切换 时 ， 新 任务 不 能 是 当前 任务 自己 。 试 想 
一 下 ， 如 果 人 允许 这 种 情况 发 生 ， 处 理 器 该 如 何 执行 现场 的 保护 和 恢复 操 
人 

第 二 种 情形 ， 如 图 15-4 所 示 ， 不 允许 使 用 CALL 指令 从 任务 3 切换 
到 任务 2 和 任务 1 上 。 如 果 不 禁 止 这 种 情况 的 话 ， 任 务 之 间 的 舱 套 关系 将 
会 因为 TSS 任务 链接 域 的 破坏 而 错乱 。 


处 理 占 是 通过 TSS 描述 符 的 B 位 来 检测 重 入 的 。 因 中 断 、iret、call 
和 jmp 指令 发 起 任务 切换 时 ， 处 理 器 固件 会 检测 新 任务 TSS 描述 符 的 B 
位 ， 如 果 为 “1”， 则 不 允许 执行 这 样 的 切换 。 


15.4 用 call/jjmpl/iret 指令 发 起 任务 切换 的 
实例 


保护 模式 下 的 中 断 和 异常 中 断 处 理 要 在 第 17 章 才 能 详细 前 述 ， 和 中 
煌 有 关 的 任务 切换 也 将 在 第 17 章 介 绍 。 在 本 章 ， 我 们 重点 关注 的 是 用 
call、jmp 和 iret 指令 发 起 的 任务 切换 。 


前 面 所 讲 的 一 切 ， 部 是 纸 上 谈 兵 ， 或 者 说 是 在 纸 上 谈 任 务 切换 。 要 
起 加 深 对 任务 切换 的 理解 ， 共 体 的 实例 是 必 不 可 少 的 ， 而 正在 执行 中 的 
代码 最 能 说 明 问 题 。 为 此 ， 让 我 们 回 到 代码 请 单 15-1 中 。 


第 938 一 945 行 是 用 来 加 载 用 户 程 序 的 。 移 分 配 一 个 任务 控制 块 
(CTCB) ， 然 后 将 它 挂 到 TCB 链 上 。 接 着 ， 压 入 用 户 程 序 的 起 始 逻辑 局 
区 号 及 其 TCB 基地 址 ， 作 为 参数 调用 过 程 load relocate program。 


过 程 load_relocate_program 的 工作 和 上 一 章 相 比 没 有 太 大 变化 ， 仅 
仅 是 对 TSS 的 填写 比较 完整 。 注 意 ， 这 是 任务 切换 的 要 求 ， 从 一 个 任务 
切换 到 男 一 个 任务 时 ， 处 理 器 要 从 新 任务 的 TSS 中 恢复 〈 加 载 ) 各 个 寄 
存 器 的 内 容 。 尺 管 这 是 任务 的 第 一 次 执行 ， 但 人 处理 器 并 不 知道 ， 这 是 它 
的 例 行 工 作 ， 你 得 把 任务 执行 时 ， 各 个 寄存 器 的 内 容 放 到 TSS 中 供 处 理 
器 加 载 。 


新 增加 的 指令 是 从 第 766 行 开 始 ， 到 790 行 结束 的 。 首 乞 ， 从 栈 中 
取出 TCB 的 基地 址 ; 然后 ， 通 过 4GB 的 内 存 段 访问 TCB， 取 出 用 户 程序 
加 载 的 起 始 地 址 ， 这 也 十 用户 程序 头 部 的 起 始 地 址 。 

接着 ， 依 次 登记 指令 指针 寄存 器 EIP 和 各 个 段 寄 存 器 的 内 容 。 因 为 
这 是 用 户 程 序 的 第 一 次 执行 ， 所 以 ，TSS 中 的 EIP 域 应 该 登记 用 户 程 序 
的 入 口 点 ，CS 域 应 该 登记 用 户 程 序 入 口上 后 所 在 的 代 公 段 选 择 子 。 


第 787 一 790 行 ， 先 将 EFLAGS 寄存 右 的 内 容 压 入 栈 ， 再 将 其 弹出 到 
EDX 寄存 右 ， 因 为 不 存在 将 标志 冤 存 右 的 内 容 完 整地 传送 到 通用 寄存 右 
的 指令 。 接 着 ， 把 EDX 中 的 内 容 写 入 TSS 中 EFLAGS 域 。 注 意 ， 这 是 当 
采 任 务 〔( 程 序 管理 右 ， EFLAGS 寄存 右 的 副本 ， 新 任务 将 使 用 这 个 副本 
作为 初始 的 EFLAGS。 一 般 来 说 ， 此 时 EFLAGS 寄存 器 的 IOPL 字段 为 


00， 将 来 新 任务 开始 执行 时 ， 会 用 这 个 副本 作为 处 理 器 EFLAGS 寄存 器 
的 当前 值 ， 并 因此 而 没有 足够 的 MO 特权 。 


好 ， 回 到 第 947 行 。 


这 是 一 条 32 位 间接 远 调 用 指令 CALL， 操 作 数 是 一 个 内 存 地 址 ， 指 
器 任务 控制 块 (TCB) 内 的 0x14 蛙 元 。 这 样 的 指令 我 们 非 第 熟 舌 ， 一 般 
来 说 ， 转 移 到 的 目标 位 置 可 以 由 16 位 的 代码 段 选 择 子 和 32 位 段 内 偏 移 量 
组 成 ， 也 可 以 由 16 位 的 调用 门 选择 子 和 32 位 偏 移 量 组 成 。 所 以 ， 从 TCB 
站 偶 移 量 为 0X14 的 地 方 ， 应 当先 是 一 个 32 位 的 段 内 仿 移 量 ， 接 看 是 一 个 
16 位 的 代码 段 或 者 调用 1 门 选 择 子 。 


但 是 ， 回 到 前 一 章 ， 看 图 14-12，TCB 内 偏 移 为 0x14 的 地 方 ， 是 任 
务 的 TSS 基地 址 。 再 往 后 ， 是 TSS 选择 子 。 这 很 奇怪 ， 是 吗 ? 但 却 是 合 
法 的 。 当 处 理 器 发 现 得 到 的 是 一 个 TSS 选择 子 ， 就 执行 任务 切换 。 和 通 
过 调用 门 的 控制 转移 一 样 ，32 位 偏 移 部 分 于 莽 不 用 。 这 就是 为 什么 我 们 
可 以 把 TSS 基地 址 作为 32 位 偏 移 量 使 用 的 原因 。 

当 执 行 任 务 切换 时 ， 人 处理 右 用 得 到 的 选择 子 访问 GDT， 一 旦 它 发 现 
那 是 一 个 TSS 描述 符 ， 束 知道 应 该 执行 任务 切换 的 操作 。 首 先 ， 因 为 当 
前 正在 执行 的 任务 是 由 任务 寄存 器 TR 指示 的 ， 所 以 ， 它 要 把 每 个 寄存 器 
的 “快照 "保存 到 由 TR 指向 的 TSS 中 。 


然后 ， 处 理 器 用 指令 中 给 出 的 TSS 选择 子 访问 GDT， 取 得 新 任务 的 
TSS 摘 述 符 ， 并 从 该 TSS 中 恢复 各 个 寄存 器 的 内 容 ， 包 括 通用 寄存 右 、 
标志 案 存 右 EFLAGS、 上 段 寄存 占 、 指 令 指 针 案 存 右 EIP、 栈 指针 寄存 右 
ESP， 以 及 局 部 描述 符 表 寄存 器 (LDTR) 等 。 最 终 ， 任 务 寄存 器 TR 指 
问 新 任务 的 TSS， 而 处 理 器 旋即 开始 执行 新 的 任务 。 

谢 天 谢 地 ， 幸 亏 我 们 已 经 在 load relocate program 过 程 内 完整 地 设 
置 了 新 任务 的 TSS， 尤 其 是 它 的 LDT 域 、EIP 域 、CS 域 和 DS 域 ，LDT 
域 指向 用 户 程序 的 局 部 描述 符 表 ，EIP 域 指 向 用 户 程序 的 入 口 点 ，CS 域 
指向 用 户 程 序 的 代码 段 ，DS 域 指向 用 户 程序 头 部 段 。 

程序 党 理 右 是 计算 机 启动 以 来 的 第 一 个 任务 ， 在 任务 切换 前 ， 其 
TSS 描述 符 的 B 位 是 “1”，EFLAGS 寄存 器 的 NT 位 是 “0”。 因 为 本 次 任务 
切换 是 用 CALL 指令 发 起 的 ， 因 此 ， 任 务 切换 后 ， 其 TSS 摘 述 符 的 B 位 
仍旧 是 “1"”，EFLAGS 寄存 器 的 NT 位 不 变 。 当 任务 切换 完成 ， 用 户 任 务 
成 为 当前 任务 ， 其 TSS 描述 符 的 B 位 置 “1”"， 表 示 该 任务 的 状态 为 忙 ; 
EFLAGS 寄存 器 的 NT 位 置 "1 人， 表示 它 般 套 于 程序 管理 需 任 务 : TSS 的 





任务 链接 域 个 修改 为 前 一 个 任务 (程序 官 理 右 任务 ) 的 TSS 插 述 从 选择 
子 。 


现在 ， 用 己 程 序 作为 任务 开始 执行 了 。 所 以 ， 让 我 们 较 到 代 但 清单 
15-2。 


总 体 上 ， 用 户 程序 的 结构 和 上 一 草 相 比 没有 变化 ， 而 且 功 能 非 闻 人 简 
单 ， 大 部 分 工作 都 是 通过 调用 门 来 完成 的 。 程 序 的 入 口 点 在 第 55 行 。 


当 用 己任 务 开始 执行 时 ， 段 寄存 帝 DS 指 癌 头 部 段 。 第 57、58 行 ， 
令 段 守 存 占 FS 指 同 头 部 段 。 其 主要 目的 是 保存 指 同 头 部 段 的 指针 以 备 后 
用 ， 同 时 ， 腾 出 段 寄存 融 DS 来 完成 后 续 操 作 。 毕 葛 ， 访 问 数据 段 时 ， 
不 加 段 超越 前 缀 会 方便 很 多 。 

第 60、61 行 ， 令 段 寄 存 器 DS 指 回 当 前 任务 自己 的 数据 段 。 


接 下 来 的 工作 是 显示 问候 语 ， 并 报告 目 己 的 当前 特权 级 别 。 因 为 当 
前 特权 级 别 是 计算 出 来 的 ， 所 以 ， 字 人 符 串 要 分 成 两 个 部 分 显示 。 第 63~ 
64 行 ， 先 显示 前 一 部 分 : 


[USER TASK]: Hi! nice to meet you,I am run at CPL= 


这 人 句 的 意思 是 “ 嗨 ， 很 高 兴 遇 到 你 ， 我 运行 的 特权 级 别 CPL="。 话 没 
有 说 完 ， 因 为 这 个 CPL 还 需要 经 过 计算 才能 知道 。 

第 66 一 69 行 ， 计 算 当 前 特权 级 别 ， 转 换 成 ASCIl 码 后 填写 到 数据 段 
中 ， 作 为 第 二 个 字符 串 的 第 1 个 字符 。 当 前 特权 级 别 是 由 段 寄 存 器 CS 当 
前 内 容 的 低 2 位 指示 的 ， 因 此 ， 先 将 CS 的 内 容 传送 到 AX 寄存 器 ; 接 
看 ， 清 除 AL 寄存 器 的 融 6 位 ， 只 你 留 低 2 位 的 原始 内 容 ; 最 后 ， 将 这 个 
数字 加 上 0x30， 转 换 成 可 显示 和 打印 的 ASCIl 码 ， 并 填写 到 数据 段 中 由 
标号 message_2 所 指示 的 字 节 单元 中 。 


第 71、72 行 ， 显 示 包 括 特 权 级 数值 在 内 的 第 二 个 字符 串 。 据 我 们 所 
知 ， 妆 前 任务 的 特权 级 别 是 3， 因 此 ， 在 屏 大 上 显示 的 完整 内 容 古 : 


LUSER TASKI* Hil! nice to meet vou;l an run at CPLS3. NOW TI must exlit,s: 


意思 是 ，“ 嗨 ， 很 高 兴 遇 到 你 ， 我 运行 的 特权 级 别 CPL=3。 现 在 ， 必 
须 退 出 吗 .，."。 


通过 在 中 断 拍 述 符 表 中 安 冯 任务 上 ]， 可 以 在 中 断 信 忆 的 驱使 下 周期 
性 地 及 起 任务 切换 。 人 否则 ， 每 个 任务 都 应 该 在 适当 的 时 候 主动 转换 到 其 
他 任务 ， 以 免 计 算 机 的 操作 者 及 现 刚 的 任务 都 僵 在 那里 没有 任何 反应 。 
如 琳 每 个 任务 部 能 目 沉 地 做 到 这 一 操 ， 那 么 ， 这 种 任务 切换 机 制 被 称 为 
是 协同 式 的 。 


一 般 来 说 ， 可 以 在 任务 内 的 任何 地 方 设置 一 条 任务 切换 指令 ， 以 发 
起 任务 切换 。 当 然 ， 如 果 你 是 为 人 采 个 流行 的 操作 系统 写 程 序 ， 必 须 昕 从 
操作 系统 设计 者 的 建议 ， 他 们 的 软件 开 友 指南 上 会 告诉 你 怎么 做 。 

当前 任务 的 做 法 稍 有 些 特 殊 ， 它 很 简单 ， 在 显示 了 信息 之 后 ， 第 74 
行 ， 通 过 调用 门 转 到 全 局 空间 执行 。 从 该 调用 门 的 符号 名 
“TerminateProgram”" 上 看 ， 意 图 是 终止 当前 任务 的 执行 ， 而 不 是 临时 转 
换 到 其 他 任务 。 


不 管 怎样 ， 让 我 们 回 到 代码 清单 15-1 中 去 ， 看 看 该 任务 在 进入 全 局 
空间 之 后 都 做 了 些 什么 。 


用 户 程序 通过 调用 门 进入 任务 的 全 局 空间 后 ， 实际 的 入 口 点 在 354 
行 ， 即 名 字 为 terminate_current task 的 过 程 。 该 过 程 用 来 结束 当前 任务 
的 执行 ， 并 转换 到 其 他 任务 。 


不 要 到 了 ， 我 们 现在 仍 处 在 用 户 任 务 中 ， 要 结束 当前 的 用 户 任 务 ， 
可 以 先 切换 到 程序 管理 器 任务 ， 然 后 回收 用 户 程 序 所 占用 的 内 存 空间 ， 
并 保证 不 再 转换 到 该 任务 。 为 了 切换 到 程序 管理 豆 任 务 ， 需 要 根据 当前 
任务 EFLAGS 寄存 硕 的 NT 位 决定 是 采用 iret 指令 ， 还 是 jmp 指令 。 

第 358 一 360 行 ， 先 将 EFLAGS 寄存 器 的 当前 内 存 压 栈 ， 然 后 ， 用 
ESP 寄存 器 作为 地 址 操作 数 访 问 栈 ， 取 得 EFLAGS 的 压 栈 值 ， 并 传送 到 
EDX 寄存 器 。 接 着 ， 将 ESP 寄存 器 的 内 容 加 上 上 4， 使 栈 平 衡 ， 保 持 压 入 
EFLAGS 寄存 右前 的 状态 。 


你 可 能 会 奇怪 ， 为 什么 不 百 接 使 用 下 面 两 条 指令 来 完成 以 上 功能 : 


pushfd 
pop edx 


的 确 ， 这 两 种 做 法 的 效果 是 一 样 的 ， 之 所 以 采用 3 条 指令 ， 征 因为 想 
演示 如 何 退 过 ESP 寄存 如 和 耳 接 访问 栈 。 在 16 位 模式 下 ， 不 能 使 用 SP 作 
为 基 址 ， 所 以 下 和 面 的 指令 是 错误 的: 


mov ax, [sp] ;错误 


注意 ， 使 用 ESP 寄存 器 作为 指令 的 地 址 操作 数 时 ， 默 认 使 用 的 段 寄 
存 器 是 SS， 即 访问 栈 段 。 

第 362、363 行 ， 令 段 寄 存 器 DS 指 同 内 核 数 据 段 ， 以 方便 后 面 的 操 
作 。 


DX 寄存 器 包含 了 标志 寄存 器 EFLAGS 的 低 16 位 ， 其 中 ， 位 14 是 
NT 位 。 第 365、366 行 ， 测 试 DX 寄存 右 的 位 14， 看 NT 标志 位 是 0 还 是 
1， 以 决定 采用 哪 种 方式 (iret 或 者 call) 回 到 程序 管理 器 任务 。 因 为 当前 
任务 是 租 僚 在 程序 管理 絮 任 务 内 的 ， 所 以 NT 位 必然 是 “1”"， 应 当 转 到 标 
号 .b1 处 继续 执行 。 


第 372、373 行 ， 也 就 是 标 写 .b1 处 ， 先 显示 字符 串 


[SYSTEM CORE]: Uf. .This Ttask initiated With CALE 1instruetion Or dah 


execCeption/ interrupt, should Use IRETD instruction to switeh back... 


该 字符 串 位 于 第 448 行 ， 是 在 内 核 数 据 段 ， 用 标 写 core_msg0 声明 
并 初始 化 的 。 该 字符 串 的 内 容 显 示 ， 消 恩 来 源 同样 是 系统 内 核 ， 访 肖 明 
的 意思 十“ 喇 .……… 该 任务 是 用 CALL 指令 ， 或 者 由 一 个 中 靳 / 寞 第 发 起 的 ， 
应 当 使 用 IRETD 指令 切换 回去 ..…...”。 


第 374 行 ， 通 过 iretd 指令 转换 到 前 一 个 任务 ， 即 程序 官 理 占 任务 。 
执行 任务 切换 时 ， 妆 前 用 户 任 务 的 TSS 描述 符 的 B 位 被 清 零 ，EFLAGS 
寄存 芥 有 的 NT 位 也 被 清 零 ， 并 被 保存 到 它 的 TSS 中 。 


注意 ， 在 此 处 ， 我 们 用 的 是 iretd， 而 不 是 iret。 实 际 上 ， 这 是 同一 条 
指令 ， 机 避 人 码 都 是 CF。 在 16 位 模式 下 ，iret 指令 的 操作 数 默认 是 16 位 
的 ， 要 按 32 位 操作 数 执行 ， 须 加 指令 前 级 0x66， 即 66 CF。 为 了 方便 ， 
编译 硕 创 造 了 iretd。 当 在 16 位 檬 式 下 使 用 iretd 时 ， 编 译 鼎 就 知道 ， 应 当 
加 上 指令 前 级 0x66。 在 32 位 模式 下 ，iret 和 iretd 是 相同 的 ， 下 面 的 示例 
展示 了 它们 之 则 的 区 别 : 


[Its .16| 


Tet ; 编译 后 的 机 器 个 为 CF 
iretd ; 编译 后 的 机 器 公 为 66 CF 
[as 32| 

et ; 编译 后 的 机 器 个 为 CF 
iretd ; 编译 后 的 机 器 人 码 为 CF 


当 程序 管理 器 任务 恢复 执行 时 ， 它 的 所 有 原始 状态 都 从 TSS 中 加 载 
到 处 理 器 ， 包 括 指令 指针 寄存 器 EIP， 它 指向 第 952 行 的 那 条 指令 ， 紧 接 
着 当初 发 起 任务 切换 的 那 条 指令 。 


对 于 刚刚 被 挂 起 的 那个 旧 任 务 ， 如 果 它 没有 锌 终止 执行 ， 则 可 以 不 
予 理会 ， 并 在 下 一 个 适当 的 时 机 再 次 切换 到 和 它 那 里 执行 。 不 过 ， 现 在 的 
情况 是 它 希 望 自 己 被 终止 。 所 以 ， 理 论 上 ， 接 下 来 的 工作 是 回收 它 所 占 
用 的 内 存 空间 ， 并 从 任务 控制 块 TCB 链 上 去 掉 ， 以 确保 不 会 再 切换 到 该 
任务 执行 (当然 ， 现 在 TCB 链 还 没有 体现 出 目 己 的 用 处 )。 遗 憾 的 是 ， 
我 们 并 没有 所 供 这 样 的 代码 。 所 以 ， 这 个 任务 将 一 二 存 在 ， 一 了 是 有效 ， 
不 会 消失 ， 在 整个 系统 的 运行 期 间 可 以 随时 切换 过 去 。 

接 下 来 ， 我 们 再 创建 一 个 新 任务 ， 并 转移 到 充任 务 执行 。 


第 952、953 行 ， 程 序 管 理 器 先 显 示 一 条 消 恩 。 标 写 prgman_msg2 
的 位 置 是 在 第 439 行 ， 位 于 内 核 数 据 段 ， 在 那里 初始 化 了 字符 串 


[PROGRAM MANAGER]: I am glad to regain control.Now,create another user 


task ang svitcech to it by the JMP 4nstruction..,.: 


这 是 程序 管理 喜 在 说 话 ， 方 括号 中 的 文字 显示 了 消息 的 来 源 。 该 消 
息 的 大 意 是 “我 很 高 兴 又 获得 了 控制 ， 现 在 ， 创 建 其 他 用 户 任 务 ， 并 使 用 
JMP 指令 切换 到 它 那 里 ”。 


第 955 一 964 行 ， 创 建新 的 用 户 任 务 并 发 起 任务 切换 。 与 上 次 相 比 ， 
这 次 的 任务 切换 有 儿 个 全 得 注意 的 特点 。 首 和 匈 ， 可 以 看 出 ， 访 任务 也 是 
从 便 盘 的 50 与 逻辑 局 区 开始 加 载 的 ， 束 是 说 ， 它 和 上 一 个 用 户 任 务 一 
人 来 和 目 同一 个 程序 。 这 束 很 清楚 地 说 明了 了， 一 个 程序 可 以 对 应 着 多 个 
运行 中 的 副本 ， 或 者 说 多 个 任务 。 尽 管 如 此 ， 它 们 彼此 却 没 有 任何 关 
系 ， 在 内 存 中 的 位 置 不 同 ， 运 行 状 态 也 不 一 样 。 


其 次 ， 这 次 是 用 JMP 指令 发 起 的 任务 切 搞 ， 新 任务 不 会 租 套 于 旧 任 
务 中 。 任 务 切换 之 后 ， 程 序 管 理 器 任务 TSS 描述 符 的 B 位 被 清 零 ， 
EFLAGS 寄存 器 的 NT 位 不 变 ; 新 任务 TSS 摘 述 符 的 B 位 置 位 ，EFLAGS 
寄存 器 的 NT 位 不 变 ， 保 持 它 从 TSS 加 载 时 的 状态 ， 任 务 链接 域 的 内 容 不 

由 于 两 个 任务 来 自 于 同一 个 程序 ， 故 完成 相同 的 工作 ， 最 终 都 会 通 
过 调用 门 进 入 任务 的 全 局 空间 执行 。 而 且 ， 在 执行 到 第 365、366 行 时 ， 
EFLAGS 寄存 器 NT 位 的 测试 结果 必定 是 零 ， 即 NT 二 0， 当 前 任务 并 未 骸 
套 于 其 他 任务 中 ， 于 是 执行 第 367 一 369 行 ， 首 先 显 示 字 符 串 : 


ISYSTEM TOREIS Ul... THIiSs task Tnitiated With IMP 1nstruct1ion, should 


switch to Program Manager directly by the JMP instruction... 


方 括号 内 显示 了 消息 的 来 源 ， 即 系统 内 核 。 该 消息 的 意思 是 ， 
“ 喇 ...... 该 任务 是 用 JMP 指令 发 起 的 ， 应 当 直 接 用 JMP 指令 转换 到 程序 
管理 器 ......”。 

然后 ， 使 用 32 位 间接 远 转 移 指 令 JMP 转换 到 程序 管理 器 任务 。 指 令 
中 的 标号 prgman_tss 位 于 内 核 数 据 段 (第 431 行 ) ， 在 那里 初始 化 了 6 
字 节 ， 即 16 位 的 TSS 摘 述 从 选择 子 和 32 位 的 TSS 基 地 址 。 按 道理 ， 这 
里 不 应 该 是 TSS 基地 址 ， 而 应 当 是 一 个 32 位 偏 移 量 。 不 过 ， 这 是 无 所 谓 
的 ， 当 处 理 器 看 到 选择 子 部 分 是 一 个 TSS 描述 符 选择 子 时 ， 它 将 偏 移 量 
丢弃 不 用 。 

从 第 二 个 任务 返回 程序 管理 器 任务 时 ， 执 行 点 在 第 966 行 。 从 这 一 
行 开 始 ， 一 直到 第 969 行 ， 用 于 显示 一 条 消息 ， 然 后 停机 。 消 息 的 内 容 
是 : 


[PROGRAM MANAGER]: I am gain control again, HALT... 


消息 的 来 源 是 程序 管理 器 任务 ， 它 说 ，“ 我 又 获得 了 控制 ， 停 机 .….… 
最 后 ， 处 理 器 执行 halt 指令 ， 终 于 变 消停 了 。 


15.5 处理 器 在 实施 任务 切换 时 的 操作 


处 理 带 用 以 下 四 种 方法 将 控制 较 换 到 其 他 任务 : 

e 当前 程序 、 任 务 或 者 过 程 执行 一 个 将 控制 转移 到 GDT 内 东 个 TSS 
接 述 符 的 jmp 或 者 call 指 令 ; 

e 当 前 程序 、 任 务 或 者 过 程 执 行 一 个 将 控制 转移 到 GDT 或 者 当前 LDT 
内 东 个 任务 门 揪 述 和 从 的 jmp 或 者 call 指令 ; 

e 一 个 异常 或 者 中 断 发 生 时 ， 中 断 吕 指向 中 断 描述 表 内 的 任务 门 ; 


e 在 EFLAGS 寄存 器 的 NT 位 置 位 的 情况 下 ， 当 前 任务 执行 了 一 个 iret 


指令 。 


jmp、call、iret 指令 或 者 异常 和 中 断 ， 是 程序 重 定 向 的 机 制 ， 它 们 所 
引用 的 TSS 摘 述 符 或 者 任务 门 ， 以 及 EFLAGS 寄存 器 NT 标志 的 状态 ， 
决定 了 任务 切换 是 个 ， 以 及 如 何 发 生 。 


在 任务 切换 时 ， 处 理 器 执行 以 下 操作 : 


CD 从 JMP 或 者 CALL 指令 的 操作 数 、 任 务 门 或 者 当前 任务 的 TSS 任 
务 链 接 域 取得 新 任务 的 TSS 描述 符 选择 子 。 最 后 一 种 方法 适用 于 以 iret 
发 起 的 任务 切换 。 

@) 检查 是 否 人 允许 从 当前 任务 《〈 旧 任务 ) 切换 到 新 任务 。 数 据 访 问 的 
特权 级 检查 规则 适用 于 jmp 和 call 指令 ， 当 前 《〈 旧 ) 任务 的 CPL 和 新 任 
务 段 选 择 子 的 RPL 必须 在 数值 上 小 于 或 者 等 于 目标 TSS 或 者 任务 门 的 
DPL。 寞 常 、 中 汤 〈 除 了 以 intn 指令 引发 的 中 断 ) 和 iret 指令 引起 的 任务 
切换 忽略 目标 任务 门 或 者 TSS 描述 符 的 DPL。 对 于 以 int n 指令 产生 的 中 
断 ， 要 检查 DPL。 


@) 检查 新 任务 的 TSS 描述 符 是 否 已 经 标记 为 有 效 (P=1) ， 并 且 界 
限 也 有 效 (大 于 或 者 等 于 0x67， 即 十 进 制 的 103) 。 

由 检查 新 任务 是 否 可 用 ， 不 忙 《B=0， 对 于 以 CALL、JMP、 异 常 或 
者 中 断 发 起 的 任务 切换 ) 或 者 忙 〈B=1， 对 于 以 iret 发 起 的 任务 切换 ) 。 

(9 检查 当前 任务 〈 旧 任务 ) 和 新 任务 的 TSS， 以 及 所 有 在 任务 切换 
时 用 到 的 段 描述 符 已 经 安排 到 系统 内 存 中 。 


@@ 如 果 任 务 切换 是 由 jmp 或 者 iret 发 起 的 ， 处 理 器 清除 当前 〈 旧 ) 任 
务 的 忙 (B) 标志 ; 如 果 是 由 call 指令 、 异 音 或 者 中 断 发 起 的 ， 忙 〈B) 
标志 保持 原来 的 置 位 状态 。 


GO 如 果 任 务 切 换 是 由 iret 指令 发 起 的 ， 人 处 理 右 建 六 EFLAGS 寄存 磊 
的 一 个 临时 副本 并 清除 其 NT 标志 ; 如果 是 由 call 指令 、jmp 指令 、 异 常 
或 者 中 发 起 的 ， 副 本 中 的 NT 标志 不 变 。 


保存 当前 〈 旧 ) 任务 的 状态 到 它 的 TSS 中 。 处 理 器 从 任务 寄存 器 
中 找到 当前 TSS 的 基地 址 ， 然 后 将 以 下 寄存 颖 的 状态 复制 到 当前 TSS 
中 : 所 有 通用 寄存 器 、 段 寄存 器 中 的 段 选择 子 、 刚 才 那 个 EFLAGS 寄存 
器 的 副本 ， 以 及 指令 指针 寄存 器 EIP。 

@) 如 果 任 务 切换 是 由 call 指令 、 异 第 或 者 中 断 发 起 的 ， 处 理 器 把 从 
新 任务 加 载 的 EFLAGS 寄存 器 的 NT 标志 置 位 ; 如 果 是 由 iret 或 者 jmp 指 
令 发 起 的 ，NT 标志 位 的 状态 对 应 着 从 新 任务 加 载 的 EFLAGS 寄存 器 的 
NT 位 。 

0 如 果 任 务 切 换 是 由 call 指令 、jmp 指令 、 异 常 或 者 中 断 发 起 的 ， 
处 理 器 将 新 任务 TSS 描述 符 中 的 B 位 置 位 ， 如 果 是 由 iret 指令 发 起 的 ，B 
位 保持 原先 的 置 位 状态 不 变 。 

@ 用 新 任务 的 TSS 选择 子 和 TSS 描述 符 加 载 任务 寄存 器 TR。 


@ 新 任务 的 TSS 状态 数据 被 加 载 到 处 理 右 。 这 包括 LDTR 寄存 器 、 
PDBR (控制 寄存 器 CR3) 、EFLAGS 寄存 器 、EIP 寄存 器 、 通 用 寄存 
锅 ， 以 及 上段 选择 子 。 和 载 入 状态 期 间 只 要 发 生 一 个 故障 ， 架 构 状 态 束 会 被 
破坏 (因为 有 些 寄 存 器 的 内 容 已 被 改变 ， 而 且 无 法 撤销 和 回 退 ，。 所 请 
架构 ， 是 指 处 理 器 对 外 公开 的 那 一 部 分 的 规格 和 构造 ， 所 谓 架 构 状 态 ， 
是 指 人 处理 絮 内 部 的 各 种 构件 ， 在 不 同 的 条 件 下 ， 所 建立 起 来 的 确定 状 
态 。 当 处 理 器 处 于 某 种 状态 时 ， 再 施加 男 一 种 确定 的 条 件 ， 可 以 进入 另 
一 种 确定 的 状态 ， 这 应 当 是 严格 的 、 众 所 周知 的 、 可 预见 的 。 否 则 ， 就 
意味 着 架构 状态 遭 到 了 破坏 。 


@ 与 段 选 择 子 相对 应 的 描述 符 在 经 过 验证 后 也 被 加 载 。 与 加 载 和 验 
证 新 任务 环境 有 关 的 任何 错误 部 将 破坏 淋 构 状态 。 注 意 ， 如 来 所 有 的 检 
得 和 保护 工作 都 已 经 成 功 实施 ， 处 理 器 提交 任务 切换 。 如 采 在 从 第 1 步 到 
第 11 步 的 过 程 中 发 生 了 不可 恢复 性 的 错误 ， 处 理 右 不 能 完成 任务 切换 ， 
并 确保 处 理 虱 返回 到 执行 友 起 任务 切换 的 那 条 指令 前 的 状态 。 如 果 在 第 
12 步 友 生 了 不可 恢复 性 的 错误 ， 架 构 状 态 将 被 极 坏 ; 如 来 在 提交 操 ( 第 
13 步 ) 之 后 发 生 了 不 可 恢复 性 的 错误 ， 处 理 器 完成 任务 切换 并 在 开始 执 
行 狐 任 务 之 前 产生 一 个 相应 的 异常 。 


@ 开始 执行 新 任务 。 


在 任务 切换 时 ， 当 前 任务 的 状态 总 要 被 保存 起 来 。 在 恢复 执行 时 ， 
处 理 占 从 EIP 寄存 融 的 保存 值 所 指 同 的 那 条 指令 开始 执行 ， 这 个 寄存 缉 
的 值 是 在 当初 任务 航 挂 起 时 体 存 的 。 


任务 切换 时 ， 新 任务 的 特权 级 别 并 不 是 从 那个 被 挂 起 的 任务 继承 来 
的 。 新 任务 的 特权 级 别 是 由 其 段 寄 存 器 CS 的 低 2 位 决定 的 ， 而 该 寄存 器 
的 内 容 取 自 新 任务 的 TSS。 因 为 每 个 任务 都 有 自己 独立 的 地 址 空间 和 任 
务 状态 段 TSS， 所 以 任务 之 间 是 彼此 隔离 的 ， 只 需要 用 特权 级 规则 控制 
对 TSS 的 访问 就 行 ， 软 件 不 需要 在 任务 切换 时 进行 显 式 的 特权 级 检查 。 

任务 状态 段 TSS 的 任务 链接 域 和 EFLAGS 寄存 器 的 NT 位 用 于 返回 
前 一 个 任务 执行 ， 当 前 EFLAGS 寄存 器 的 NT 位 是 “人 "表明 当前 任务 嵌 套 
于 其 他 任务 中 。 无 论 如 何 ， 新 任务 的 TSS 描述 符 的 B 位 都 会 被 置 位 ， 旧 
任务 的 B 位 取决 于 任务 切换 的 方法 。 表 15-1 给 出 了 不 同 条 件 下 ，B 位 、 
NT 位 和 任务 链接 域 的 变化 情况 。 


表 15-1 不 同 任务 切换 方法 对 B 位 、NT 位 和 任务 链接 域 的 影响 


标志 或 TSS 任务 链接 域 jmp 指令 的 影响 call 指令 或 中 断 的 影响 


新 任务 的 B 位 置 位 。 原 先 必 须 为 零 置 位 。 原 先 必须 为 零 不 变 。 原 先 必须 被 置 位 
旧 任 务 的 B 位 
新 任务 的 NT 标志 


旧 任务 的 NT 标志 


新 任务 的 任务 链接 域 





日 任务 的 任务 链接 域 


15.6 程序 的 编译 和 运行 


自 先 ， 虚 拟 便 盘 主 引 叶 司 区 依然 你 留 和 上 一 革 相 同 的 内 容 。 然 后 ， 
编译 本 章 中 所 供 的 两 个 产程 序 并 写 入 虚拟 价 抢 。 近 要求 ， 从 逻辑 局 区 1 开 
始 写 入 内 核 程序 ， 从 远 辑 琐 区 50 写 入 用 户 程序 。 


完成 后 ， 局 动 虚拟 机 ， 应 该 可 以 看 到 图 15-5 所 示 的 男 面 。 





LEARN-ASM [正在 运行 ] - Oracle VM VirtualBox le| % 


Uou seen this message,that means we are now in protect mode,and the system 
loaded ,and the video display routine works perfectly. 


AMD Sempron(tm) 145 Processor 
| Syustem wide CALL-GATE mounted . 


[PROGRAM MANAGER]: Hello?y I am Program Manager ,run at CPL=O.Now,create user task 
and Switch to it by the CALL instruction... 


[USER TASK]: Hiy mice to meet you,l am run at CPL=3.Now,l must exit... 


[SYSTEM CORE]: Uh...This task initiated with CALL instruction or an exeception/ 
interrupt,should use IRETD instruction to Switch back... 


[PROGRAM MANAGER]: I am glad to regain control.Now,create another user task and 
switch to it by the JMP instruct ion. 


[USER TASK]: Hi¢? nice to meet you,l am run at CPL=3.Now,l must exit... 





[SYSTEM CORE]: Uh...This task initiated with JMP instruction, should switch to 
| Manager directly by the JMP instruction... 


[PROGRAM MANAGER]: I am gain control again,HALT..._ 


| 四 本 2 乡 旦 本 和 辣 | DB 因 Right ctrl 





图 15-5 ”本 章程 序 运行 结 


本 章 习 题 


1. 修改 本 草 的 源 程 序 ， 使 之 能 够 顺序 完成 以 下 工作 : 

GD 从 程序 管理 融 任 务 切换 到 任务 A， 显 示 消 息 后 返回 程序 管理 吾 ; 

@ 从 程序 管理 融 任 务 切换 到 任务 B， 显 示 消 息 后 返回 程序 管理 吾 ; 

(3) 再 从 程序 管理 颖 任务 切换 到 任务 A， 显示 为 一 条 消 晨 ， 然 后 返回 
程序 官 理 器 ; 

网 再 从 程序 管理 硕 任 务 切换 到 任务 B， 显 示 另 一 条 消息 ， 再 返回 程 
序 管 理 器 。 

2. 修改 本 章 源 程序 ， 使 之 能 够 顺序 完成 以 下 工作 : 

(DD 从 程序 管理 器 任务 切换 到 任务 A， 显 示 一 条 消 妃 ; 

(2) 再 从 任务 A 转换 到 任务 B， 蛇 示 一 条 消息 ; 

(3) 从 B 直接 返回 到 程序 管理 天 任 务 。 


第 16 章 ”分 页 机 制 和 动态 页 面 分 配 


Intel 处 理 絮 访问 内 存 的 基本 策略 是 分 上段。 在 16 位 实 模式 下 ， 段 的 起 
始 位 置 必 须 对 齐 在 16 字 节 边界 上 ， 而 且 段 的 长 度 最 大 为 64KB。 

进入 32 位 保护 模式 之 后 ， 进 一 步 强 化 了 分 段 功 能 ， 并 提供 了 保护 机 
制 。 此 时 ， 段 可 以 起 始 于 任何 位 置 ， 段 的 长 度 可 以 扩展 到 处 理 喜 的 最 大 
寻 址 范围 边界 。 典 型 地 ， 早 期 的 32 位 处 理 露 拥有 32 根 地 址 线 ， 因 此 ， 段 
的 长 度 可 以 扩展 到 4GB。 


在 32 位 保护 模式 下 ， 对 有 段 的 访问 本 看 “ 先 登 记 ， 后 访问 "的 原则 进 
行 。 登 记 束 是 在 GDT 或 LDT 中 登记 段 的 描述 符 ， 规 定 了 段 的 地 址 和 边 
界 ， 以 及 访问 权限 ; 访问 时 ， 则 需要 拿 着 一 个 段 摘 述 符 的 选择 子 才 行 ， 
这 就 是 传说 中 的 “ 虎 符 "。 处 理 占 用 上段 界限 和 特权 级 别 来 审查 对 上 段 的 访问 ， 
任何 非法 的 造访 行为 都 会 被 处 理 器 阻止 ， 并 立即 拉 啊 和 警报， 也 就 是 所 谓 
的 异常 中 靳 。 

一 般 来 说 ， 人 们 使 用 计算 机 要 先 安 装 一 个 操作 系统 。 在 这 种 情况 
下 ， 段 是 由 操作 系统 负 员 管理 的 。 操 作 系 统 加 载 应 用 程序 ， 根 据 程序 的 
要 求 ， 为 它 创建 一 个 或 多 个 段 ， 然 后 把 控制 权 交 给 它 。 

当 同 时 运行 的 程序 和 任务 很 多 时 ， 内 存 可 能 束 不 够 用 了 。 这 时 ， 操 
作 系 统 的 价值 束 体 现 出 来 让。 每 个 段 描述 从 有 A 位 ， 每 当 访 问 一 个 有 段 
时 ， 处 理 需 会 将 其 置 位 。A 位 的 清 零 由 操作 系统 定时 进行 ， 它 可 以 信和 此 
机 会 统计 段 的 访问 频 度 。 当 内 存 不 够 用 时 ， 它 可 以 将 那些 较 少 访问 的 段 
换 出 到 磁盘 上 ， 以 腾 出 空间 来 给 马上 要 运行 的 段 使 用 。 一 旦 某 个 段 被 挪 
到 磁盘 上 ， 操 作 系 统 应 当 将 其 描述 人 符 的 P 位 清 零 。 过 一 段 时 间 ， 当 这 个 
段 又 被 访问 时 ， 因 其 描述 符 的 P 位 是 “0”， 处 理 器 引发 段 不 存在 异 兹 《中 
断气 为 11) 。 这 类 中 上 断 通 弟 是 由 操作 系统 负责 处 理 的 ， 它 会 用 同样 的 方 
法 腾 出 空间 ， 将 这 个 段 的 内 容 从 磁盘 调 入 内 存 。 当 这 类 中 断 返 回 时 ， 处 
理 硕 会 再 次 执行 引发 异常 的 那 条 指令 (而 不 是 下 一 条 指令 ) ， 于 是 程序 
叉 能 继续 执行 了 。 

但 是 ， 因 为 段 的 长 度 不 定 ， 在 分 配 内 存 时 ， 可 能 会 发 生 内 存 中 的 衬 
闲 区 域 小 于 要 加 载 的 段 ， 或 者 空闲 区 域 远 远大 于 要 加 载 的 段 。 在 前 一 种 
情况 下 ， 需 要 另外 寻找 合适 的 空 亲 区域; 在 后 一 种 情况 下 ， 分 配 会 成 


功 ， 但 太 过 于 浪费 。 为 了 解决 这 个 问题 ， 从 80386 处 理 硕 开始 ， 引 入 了 
分 页 机 人 制 。 


分 页 功能 从 总体 上 说 ， 是 用 长 上 度 固 定 的 页 来 代 丛 长 度 不 一 定 的 段 ， 
稍 此 解决 因 段 长 度 不 同 而 市 来 的 内 存 空间 定理 问题 。 尺 官 操作 系统 也 可 
以 用 软件 来 实施 固定 长 度 的 内 存 分 配 ， 但 太 过 于 复杂 ， 由 处 理 右 固件 来 
做 这 件 事 ， 可 以 使 速度 和 效率 最 大 化 。 


本 章 的 学 习 目 标 是 : 


1. 了 解 足 目录 、 抽 表 的 结构 和 作用 ， 清 楚 为 什么 当 我 们 访问 一 个 段 
中 的 东 蛙 元 时 ， 人 处 理 右 能 准确 地 知 违 它 在 哪个 页 ， 以 及 页 内 位 置 的 基本 
原理 。 


2. 了 解 开 局 分 外 机 制 的 方法 和 需要 的 准备 工作 。 


3. 了解 任务 的 全 局 空间 和 局 部 空间 是 如 何 与 它 的 页 目录 建立 映射 天 
系 的 。 


4 学习 按 需 分 配 页 面 〈 动 态 分 配 页 面 ) 的 一 般 方 法 。 


5. 因为 在 分 页 机 制 下 无 法 使 用 物理 地 址 工作 ， 因 此 ， 需 要 掌握 用 线 
性 地 址 访问 页 目录 表 和 页 表 ， 并 修改 目录 项 及 页 表 项 的 手段 。 

6. 了解 什么 是 平坦 内 存 模型 ， 学 习 如 何在 平坦 模型 下 创建 程序 的 段 
摘 述 符 ， 知 道 回 上 扩展 的 数据 段 也 能 作为 栈 段 。 

7. 学 习 用 Bochs 调试 分 页 机 制 下 的 程序 。 

8. 学 习 奋 干 新 的 x86 指令 ， 包 括 bts、btr、btc 和 bt 等 。 


16.1 分 页 机 制 概述 
16.1.1 简单 的 分 页 模型 


分 段 的 内 存 定 理 模式 是 我 们 青 熟 入 不 过 的 了 ， 因 为 这 是 我 们 一 贯 的 
工作 方式 。 如 图 16-1 所 示 ， 在 处 理 帮 中 有 人 负 贡 分 段 管理 的 段 部 件 。 每 个 
程序 或 任务 部 有 目 己 的 段 ， 这 些 段 部 用 上 段 拍 述 从 定义 。 随 看 程序 的 执 
行 ， 当 要 访问 内 存 时 ， 束 用 段 地 址 加 上 偏 移 量 ， 上 段 部 件 束 会 输出 一 个 线 
性 地 址 。 在 单纯 的 分 段 模 式 下 ， 线 性 地 址 束 古 物理 地 址 。 


内 存 


描述 符 中 的 段 基 地 址 为 
0x00200000， 界 限 为 


0x2007, 学 节 粒 度 00202008 


i 线性 地 址 
处 理 器 的 段 管理 部 件 
偏 移 量 
00200000 


[ 


于 


图 16-1 分 段 机 制 下 的 线性 地 址 就 是 物理 地 址 


正如 图 16-1 所 示 ， 摘 述 符 中 的 段 基 地 址 为 0x00200000， 界 限 值 为 
0x2007。 因 为 段 的 粒度 是 字 节 ， 故 该 段 的 长 度 为 8200 字 节 。 当 访问 内 存 
时 ， 用 段 基 地 址 0x00200000 加 上 上 段 内 偏 移 量 0x1008， 上 段 部 件 束 会 形成 
线性 地 址 0x00201008， 这 也 是 物理 地 址 。 


一 旦 决定 采用 页 式 内 存 管 理 ， 束 应 当 把 4GB 内 存 分 成 大 小 相同 的 
页 。 但 是 ， 页 在 物理 内 存 中 位 置 是 有 讲究 的 ， 并 不 是 在 内 存 中 随便 找 个 
位 置 ， 说 :“ 来 ， 页 就 从 这 里 开始 ! "事实 上 ， 不 是 这 样 的 。 如 图 16-2 所 
示 ， 页 的 最 小 单位 是 4KB， 也 就 是 4096 字 节 ， 用 十 六 进 制 数 表示 就 是 
0x1000。 因 此 ， 第 1 个 页 的 物理 地 址 是 0x00000000， 第 2 个 页 的 物理 地 


址 是 0x00001000， 第 3 个 页 的 物理 地 址 是 0x00002000，...... ， 最 后 一 个 
页 的 物理 地 址 是 0xFFFFF000 。 这 样 ， 可 以 将 4GB 内存 划 分 为 
1048576 (0x100000) 个 页 。 很 显然 ， 页 的 物理 地 址 ， 其 低 12 位 始终 为 
2 

段 管理 机 制 对 于 Intel 处 理 需 来 说 是 最 基本 的 ， 任 何 时 候 都 无 法 关 
闭 。 也 就 是 说 ， 即 使 局 用 页 管理 功能 ， 分 段 机 制 依然 是 起 作用 的 ， 段 音 
件 也 依然 工作 。 


分 页 机 制 也 没有 增加 程序 员 的 负担 ， 程 序 依然 是 按 段 来 组 织 的 。 问 
题 在 于 ， 如 何 将 较 天 的 段 ， 映 射 到 大 小 相同 的 页 面 上 呢 ? 


4GB 内 存 


FFFFF000 


FFFFE000 





FFFFD000 
共 1048576 个 页 面 
00003000 


00002000 


00001000 





00000000 


图 16-2 ”将 4GB 内 存 划分 成 以 4KB 为 单位 的 页 
如 图 16-3 所 示 ， 内 和 存 的 分 配 涉 及 段 空间 的 分 配 和 页 分 配 。 请 仔细 看 


这 幅 图 ， 左 边 是 虚幻 的 ， 或 者 说 虚拟 的 4GB 内 存 空间 ， 称 为 虚拟 内 存 ; 
右边 昵 ， 是 实 实 在 在 的 内 存 ， 被 分 成 1048576 个 4KB 页 面 。 


虚拟 内 存 物理 内 存 
FFFFFFFF 


FFFFF000 
FFFFE000 


FFFFD000 


00008000 

ee 
RR 00007000 
A 0x00202000 一 0x00202007 -= 00006000 
i 00005000 

8200 字 节 5 i 4KB 页 〈 未 分 配 ) 
~、、 00004000 
00200000 、 4KB 页 
NM 0x00200000 一 0x00200FFF - - - - 00003000 


We ga ets 4KB 页 (未 分 配 ) 
00002000 


4KB 页 


4KB 页 


00001000 
00000000 





00000000 


图 16-3 ” 段 到 页 的 映射 


在 分 页 模式 下 ， 操 作 系 统 可 以 创建 一 个 为 所 有 任务 共用 的 4GB 虚拟 
内 存 空 间 ， 也 可 以 为 每 一 个 任务 创建 独立 的 4GB 虚拟 内 存 空 间 ， 这 都 是 
可 行 的 。 当 一 个 程序 加 载 时 ， 操 作 系 统 既 在 要 左边 的 虚拟 内 存 中 分 配 段 
空间 ， 又 要 在 右边 的 物理 内 存 中 分 配 相 应 的 页 面 。 因 此 ， 第 一 个 步骤 是 
寻找 空 用 的 段 空间 ， 该 段 空间 既 没 有 被 其 他 程序 使 用 ， 也 没有 被 同一 程 
序 内 的 其 他 段 使 用 。 比 如 图 16-3 所 示 ， 假 设 已 经 成 功 找 到 并 分 配 了 一 个 
段 空 间 ， 基 地 址 为 0x00200000， 长 度 为 8200 字 节 。 


页 的 最 小 尺寸 是 4KB， 也 就 是 4096 字 节 。 因 此 ，8200 字 节 的 段 ， 
需要 占用 3 个 页 面 ， 其 中 最 后 一 个 页 面 只 用 了 8 个 字 节 ， 其 余 都 浪费 着 ， 
但 这 无 关 紧 要 ， 如 果 人 允许 页 共 至 ， 多 个 段 或 多 个 程序 可 以 用 同一 个 页 来 
存放 各 目的 数据 。 


在 分 段 之 后 ， 操 作 系 统 的 任务 是 把 段 拆 开 ， 并 分 别 映射 到 物理 页 。 
注意 ， 上 段 必 须 是 连续 的 ， 但 不 要 求 所 分 配 的 页 部 是 连续 的 、 挨 在 一 起 
的 。 事 实 上 ， 在 开机 之 后 ， 会 运行 不 同 的 程序 ， 这 都 要 分 配 页 。 然 后 ， 
有 些 程序 关闭 了 了 了， 页面 要 回收 。 几 个 回合 下 来 ， 空 闲 的 页 堆 堆 人 散 散 地 分 
布 在 物理 内 存 中 ， 一 般 不 会 是 连续 的 。 分 配 页 面 时 ， 操 作 系 统 会 搜索 那 
些 空 闲 的 页 ， 并 分 配给 程序 使 用 ， 所 分 配 页 面 的 总 长 度 要 大 于 等 于 段 长 
度 。 

作为 一 个 具体 的 例子 ， 操 作 系 统 为 程序 分 配 了 一 个 段 ， 段 症 在 虚拟 
内 存 中 分 配 的 ， 起 始 地 址 为 0x00200000。 该 段 有 8200 字 节 ， 需 要 分 配 3 
个 页 面 。 为 此 ， 操 作 系 统 在 物理 内 存 中 搜索 可 用 的 空 页 ， 还 真 找 到 
了 ， 这 三 个 页 面 的 物理 地 址 分 别 是 0x00002000 、0x00004000 和 
0x00007000。 接 下 来 ， 要 建立 线性 地 址 和 页 之 间 的 对 应 关系 ， 在 图 中 ， 
0x00200000 一 0x00200FFF 对 应 着 物理 地 址 为 0x00002000 的 页 ， 
0x00201000 ~ 0x00201FFF 对 应 着 物理 地 址 为 0x00004000 的 页 ， 
0x00202000 一 0x00202007 对 应 看 物理 地 址 为 0x00007000 的 页 。 当 
然 ， 这 里 只 是 示例 ， 线 性 地 址 区 间 和 页 的 对 应 关系 可 以 随意 。 


4GB 虚拟 内 存 空 间 不 可 能 用 来 你 存 任何 数据 ， 因 为 它 是 虚拟 的 ， 写 
只 是 用 来 指示 内 存 的 使 用 情况 。 当 操作 系统 加 载 一 个 程序 并 创建 为 任务 
时 ， 操 作 系 统 在 虚拟 闪存 空间 寻找 空 亲 的 段 ， 并 映射 到 空 采 的 页 。 然 
后 ， 到 真正 开始 加 载 程 计时 ， 再 把 原本 属于 段 的 数据 按 页 的 尺寸 拆 开 ， 
分 开 写 入 对 应 的 页 中 。 


从 段 部 件 输出 的 是 线性 地 址 ， 或 者 叫 虚 拟 地 址 。 为 了 根据 线性 地 址 
找到 页 的 物理 地 址 ， 操 作 系 统 必须 维护 一 张 表 ， 把 线性 地 址 转换 成 物理 
Pn, J Me 

如 图 16-4 所 示 ， 因 为 有 1048576 个 页 ， 所 以 转换 表 也 有 1048576 
项 。 这 是 个 一 维 表格 ， 每 个 表 项 占 4 字 节 ， 内 容 为 页 的 物理 地 址 。 这 个 表 
格 的 用 法 是 这 样 的 : 因为 页 的 尺寸 是 4KB， 故 ， 线 性 地 址 的 低 12 位 可 用 
于 访问 页 内 偏 移 ， 高 20 位 可 用 于 指定 一 个 物理 页 。 因 此 ， 把 线性 地 址 的 
高 20 位 当成 索引 ， 乘 以 4， 作 为 表 内 偶 移 量 ， 从 表 中 取出 一 个 双 字 ， 那 
就 是 该 线性 地 址 所 对 应 的 页 的 物理 地 址 。 


如 图 16-4 所 示 ， 如 果 执 行 指令 


mov edx, [0x20021] 


那么 ， 段 部 件 用 段 地 址 0x00200000 加 上 指令 中 给 出 的 偏 移 量 
0x2002， 得 到 线性 地 址 0x00202002。 线 性 地 址 的 高 20 位 是 表格 索引 ， 
即 0x00202 。 将 索引 乘 以 4， 得 到 0x00808， 这 就 是 表 内 偏 移 。 看 图 ， 从 
该 单元 可 以 取出 一 个 双 字 0x00007000， 这 就 是 页 物理 地 址 。 


线性 地 址 的 低 12 位 是 页 内 偏 移 量 ， 用 页 物理 地 址 加 上 页 内 偏 移 量 ， 
就 是 最 终 的 物理 内 存 地 址 。 0x00007000 加 上 0x002， 得 到 
0x00007002， 这 就 是 实际 要 访问 的 物理 内 存 地 址 。 


问题 在 于 ， 为 什么 在 表 内 偏 移 量 为 0x00808 的 地 方 ， 会 恰好 是 页 地 
址 0x00007000， 而 不 是 其 他 页 地 址 昵 ? 问 得 好 。 当 程序 加 载 时 ， 操 作 系 
统 会 首先 在 虚拟 内 存 中 分 配 段 。 然 后 ， 根 据 段 需要 分 成 多 少 页 ， 来 搜索 
空 | 内 页 面 。 当 上 段 较 大 时 ， 要 按 页 的 尺寸 分 成 好 几 个 地 址 区 段 ， 操 作 系 统 
用 每 个 区 段 的 首 地 址 ， 取 高 20 位 ， 乘 以 4， 作 为 偏 移 量 访问 表格 ， 并 将 
分 配给 该 区 段 的 页 的 物理 地 址 写 入 该 表 项 。 最 后 ， 把 原本 需要 写 入 每 个 
区 段 的 程序 数据 ， 写 到 对 应 的 页 中 。 


物理 内 存 


FFFFF000 


FFFFE000 





FFFFDU000 


映射 表 00008000 
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共 1048576 个 表 项 000800 | 00002000 00004000 
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Se 00003000 
gg en 4KB 页 (未 分 配 ) 


00002000 
十 00000C 00003000 
Mami ee 4KB 页 
十 000008 00001000 
00001000 


十 000004 00203000 


4KB 页 
十 000000 FFFED000 
00000000 


图 16-4 ”从 线性 地 址 到 页 物理 地 址 的 映射 


注意 了 了， 在 页 却 内 存 管理 中 ， 页 面 的 管理 和 分 配 征 独立 的 ， 和 分 段 
以 及 段 地址 没有 关系。 操作 系统 所 要 做 的 ， 束 是 寻找 空 几 页 面 ， 把 它 分 
配给 需要 的 段 ， 并 将 页 的 物理 地 址 填写 到 映射 表 内 。 很 显然 ， 也 很 重要 
的 结论 是 ， 线 性 地 址 ， 包 括 线性 地 址 空间 ， 和 页 面 分 配 机 制 没 有 关系 。 


基于 以 上 特 操 ， 同 时 为 了 充分 挖 据 分 页 内 存 官 理 的 潜力 ， 一 般 来 
说， 每 个 任务 都 可 以 拥有 4GB 的 虚拟 内 存 空间 ; 同时 ， 每 个 任务 都 有 目 
己 的 页 映射 玫 ， 如 图 16-5 所 示 。 


尽管 有 很 多 任务 ， 而 且 每 个 任务 都 有 目 己 的 4GB 虚拟 内 存 空 间 ， 但 
是 ， 很 重要 的 是 ， 在 整个 系统 中 ， 物 理 页 面 是 统一 调配 的 。 考 虑 这 样 一 
种 情景 : 任务 A 有 一 个 段 ， 段 基地 址 为 0x00050000， 段 长 度 为 3000 字 
节 ， 操 作 系 统 为 它 分 配 了 一 个 物理 地 址 为 0x08001000 的 页 。 过 了 一 会 
儿 ， 男 一 个 任务 B 加 载 了 ， 它 也 有 一 个 段 ， 段 基地 址 也 是 0x00050000， 





段 长 度 为 4096 字 节 。 此 时 ， 操 作 系 统 则 分 配 男 一 个 不 同 的 、 物 理 地 址 为 
0x00700000 的 页 。 在 这 种 情况 下 ， 在 任务 A 内 访问 线性 地 址 
0x00050006， 访 问 的 其 实 是 物理 地 址 0x08001006; 在 任务 B 内 访问 同 
样 的 线性 地 址 时 ， 访 问 的 其 实 是 物理 地 址 0x00700006。 


为 一 个 会 被 质疑 的 问题 是 ， 每 个 任务 部 有 4GB 虚拟 内 存 空 间 ， 而 物 
理 内 存 只 有 一 个 ， 最 大 也 才 4GB， 根 本 不 够 分 的 。 事 实 上 ， 的 确 不 够 分 
配 。 但 和 是 ， 拧 作 系统 可 以 将 暂时 不 用 的 页 退 避 到 磁盘 ， 调 入 与 上 束 要 使 
用 的 足 ， 通 过 这 种 手段 来 实现 分 页 内 存 管理 。 这 就 是 为 什么 内 存 容量 较 
小 时 ， 和 程序 越 来 越 慢 ， 便 盘 工 作 指 示 娄 不 集 地 闪烁 的 原因 。 


以 上 ， 融 是 基本 的 段 页 却 内 存 官 理 机 制 。 
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图 16-5 ”基本 的 段 页 陈 内 存 管理 示意 图 


16.1.2 页 目录 、 页 表 和 页 


第 一 个 支持 分 页 内 存 管理 模式 的 Intel 处 理 器 是 80386， 那 个 时 候 ， 
分 页 机 制 是 很 简单 的 。 几 十 年 弹指 一 挥 间 ， 处 理 器 变 得 更 为 强大 ， 而 分 
页 机 制 也 变 得 复杂 。 任 何事 物 都 具有 惯性 ， 更 何况 IT 界 的 人 党 说 ， 软 件 
的 发 展 速度 远 和 远 跟 不 上 人 硬件 的 前 进步 做 。 说 得 好 ， 虽 然 分 页 机 制 在 最 新 
的 处 理 堪 上 并 非 那么 简单 ， 但 新 机 制 毕竟 用 得 很 少 ， 倒 是 早先 的 分 页 机 
制 依然 那么 流行 。 男 一 方面 ， 因 为 羔 容 方面 的 原因 ， 最 初 的 分 页 机 制 是 
所 有 人 处理 器 都 支持 的 ， 从 最 初 的 分 页 机 制 开 始 学 习 ， 可 以 很 容易 进一步 
理解 其 他 分 页 机 制 ， 毕 葛 它 们 是 一 脉 相 承 的 。 


我 们 知道 ， 为 了 完成 从 虚拟 地 址 〈 线 性 地 址 ) 到 物理 地 址 的 转换 ， 
操作 系统 应 当 为 每 个 任务 准备 一 张 页 映射 表 。 因 为 任务 的 虚拟 地 址 空间 
为 4GB， 可 以 分 出 1048576 个 页 ， 所 以 ， 映 射 表 需要 1048576 个 表 项 ， 
用 于 存放 页 的 物理 地 址 。 叉 因为 每 个 表 项 占 4 字 节 ， 所 以 ， 轴 射 表 的 总 大 
小 为 4MB。 


没 错 ， 这 张 表 很 大 ， 要 占用 相当 一 部 分 内 存 空间 ， 考 处 到 在 实践 
中 ， 没 有 哪个 任务 会 真 的 用 到 所 有 表 项 ， 却 其 量 只 是 很 小 一 部 分 ， 这 就 
人 很 浪 窒 了 。 

当然 ， 你 可 能 会 建议 完 划 出 一 小 块 内 存 给 它 ， 然 后 ， 根 据 坝 要 再 动 
态 扩 展 。 的 确 ， 这 是 可 行 的 。 但 是 ， 因 为 一 个 特殊 的 原因 ， 这 张 表 在 实 
际 使 用 的 时 候 ， 它 的 前 半 部 分 和 后 半 部 分 会 被 同时 用 a 到。 具体 是 什 么 原 
因 ， 与 上 束 要 讲 到 ， 也 正和 是 因为 这 个 尚未 次 明 的 原因 ， 这 张 表 从 一 开始 
束 必 须 完 全 定义 ， 而 且 不 可 如 免 地 要 占用 4MB 内 存 空 间 。 为 了 解雇 这 个 
问题 ， 同 时 又 不 会 当 费 至 贯 的 内 存 空 间 ， 处 理 右 设计 了 层次 化 的 分 页 结 
你]。 


分 页 结构 层次 化 的 主要 手段 是 不 采用 时 一 的 映射 表 ， 取 而 代 之 的 是 
页 目录 表 和 页 表 。 如 图 16-6 所 示 ， 首 先 ， 因 为 4GB 的 虚拟 内 存 空间 对 应 
着 1048576 个 4KB 的 页 ， 可 以 随机 地 抽取 这 些 页 ， 将 它们 组 织 在 1024 个 
页 表 内 ， 每 个 页 表 可 以 容纳 1024 个 页 。 页 表 内 的 每 个 项 目 叫 做 页 表 项 ， 
占 4 字 节 ， 存 放 的 是 页 的 物理 地 址 ， 故 每 个 页 表 的 大 小 是 4KB， 正 好 是 一 
个 标准 页 的 长 度 。 


注意 ， 页 在 页 表 内 的 分 布 征 随机 的 ， 哪 个 页 位 于 哪个 页 表 中 ， 这 征 
没有 规律 的 。 在 一 个 真实 的 系统 中 ， 老 任务 不 断 被 和 天 闭 ， 新 任务 不 断 被 


创建 并 投入 运行 ， 页 面 的 回收 和 再 分 配 疫 有 什么 规律 可 言 。 


由 于 页 表 中 存放 的 是 页 的 物理 地 址 ， 故 每 个 页 表 项 占 4 字 节 ， 这 样 ， 
每 个 负 表 占 4096 字 节 ， 正 好 是 一 个 物理 页 的 大 小 ， 可 以 很 方便 地 用 一 个 
物理 页 来 定义 每 个 页 表 。 


如 图 16-6 所 示 ， 在 将 1048576 个 页 归 拢 到 1024 个 页 表 之 后 ， 接 
看 ， 和 再 用 一 个 表 来 指 癌 1024 个 页 表 ， 这 就 是 页 目录 表 〈Page Directory 
Table，PDT) ， 和 页 表 一 样 ， 页 目录 项 的 长 度 为 4 字 节 ， 填 写 的 是 页 表 
的 物理 地 址 ， 共 指 同 1024 个 表 页 ， 所 以 页 目录 表 的 大 小 是 4KB， 正 好 是 
一 个 标准 页 的 长 度 。 
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图 16-6 页 目录 、 页 表 和 页 的 对 应 关系 





这 样 的 层次 化 分 页 结构 是 每 个 任务 都 拥有 的 ， 或 者 说 ， 每 个 任务 都 
有 自己 的 页 目录 和 页 表 。 如 图 16-7 所 示 ， 在 处 理 堪 内 部 ， 有 一 个 控制 寄 
存 器 CR3， 存 放 痢 当前 任务 页 目录 的 物理 地 址 ， 故 又 叫做 页 目录 基 址 寄 
存 器 (Page Directory Base Register，PDBR ) 。 


每 个 任务 都 有 目 己 的 任务 状态 段 (TSS) ， 它 是 任务 的 标志 性 结 
构 ， 存 放 了 和 任务 相关 的 各 种 数据 ， 其 中 惑 包括 了 CR3 寄存 如 域 ， 和 存放 
了 任务 目 己 的 页 目录 物理 地 址 。 当 任务 切换 时 ， 处 理 硕 切换 到 痢 任 务 开 
始 执行 ， 而 CR3 寄存 右 的 内 容 也 被 更 新， 以 指 问 新 任务 的 页 目录 位 办 。 
相应 地 ， 页 目录 义 指 问 一 个 个 的 足 表 ， 这 束 使 得 每 个 任务 部 只 在 目 己 的 
地 址 空间 内 运行 。 


从 图 16-7 中 还 可 以 看 出 ， 页 目录 和 页 表 也 是 普通 的 页 ， 混 迹 于 全 部 
的 物理 页 中 。 它 们 和 普通 页 的 不 同 之 处 仅 仪 在 于 功能 不 一 样 。 当 任务 撤 
销 之 后 ， 它 们 和 任务 所 占用 的 普通 页 一 样 会 家 回收 ， 并 分 配给 其 他 任 
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图 16-7 ”整个 分 页 系统 的 全 局 视图 


16.1.3 ”地 址 变换 的 具体 过 程 


对 于 Intel 处 理 占 来 说 ， 有 关 分 足 ， 最 人 简 里 和 最 基本 的 机 制 束 是 这 
些 : CR3 寄存 器 给 出 了 页 目录 的 物理 基地 址 ， 页 目录 给 出 了 所 有 页 表 的 
物理 地 址 ， 而 每 个 页 表 给 出 了 它 所 包含 的 页 的 物理 地 址 。 好 了 ， 该 清楚 
的 部 清楚 了， 唯一 还 不 明日 的 ， 应 该 十 如 何 用 这 种 层次 性 的 分 页 结构 把 
线性 地 址 转换 成 物理 地 址 ? 


这 里 有 个 例子 。 


假如 某 个 任务 加 载 后 ， 操 作 系 统 根 据 它 的 实际 情况 ， 在 其 4GB 虚拟 
地 址 空间 里 创建 了 一 个 段 ， 段 的 起 始 地 址 为 0x00800000， 段 界限 值 为 
0x5000， 字 节 粒 度 。 当 该 任务 执行 时 ， 段 寄存 嚣 DS 指 问 该 段 。 叉 假设 
执行 了 下 面 一 条 指令 : 


mov EO [OUXLUSUO| 


此 时 ， 段 部 件 会 输出 线性 地 址 0x00801050 。 在 没有 开启 分 页 机 制 
时 ， 这 就 是 要 访问 的 物理 内 存 地 址 ， 但 现在 开启 了 分 页 机 制 ， 所 以 ， 这 
是 一 个 虚拟 地 址 ， 要 经 过 页 部 件 的 转换 ， 才 能 得 到 物理 地 址 。 


如 图 16-8 所 示 ， 人 处 理 占 的 页 部 件 专 门 负 贡 线 性 地 址 到 物理 地 址 的 转 
换 工 作 。 它 首先 将 段 部 件 送 来 的 32 位 线性 地 址 截 成 3 段 ， 分 别 是 高 10 
位 、 中 间 的 10 位 和 低 12 位 。 高 10 位 是 页 目录 的 索引 ， 中 间 10 位 是 页 表 
的 索引 ， 低 12 位 则 作为 页 内 偏 移 来 用 。 
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CR3 寄 存 器 
i 
图 16-8 页 部 件 把 线性 地 址 转换 为 物理 地 址 的 例子 


当前 任务 页 目录 的 物理 地 址 在 处 理 器 的 CR3 寄存 器 中 ， 假 设 它 的 内 
容 为 0x00005000。 段 管理 部 件 输出 的 线性 地 址 是 0x00801050， 其 二 进 
制 的 形式 为 0000 0000 1000 0000 0001 0000 0101 0000 。 高 10 位 为 
0000000010， 也 就 是 十 六 进 制 的 0x002， 它 是 页 目录 表 内 的 索引 ， 处 理 





厂 将 它 乘 以 4《 因 为 每 个 目录 项 为 4 字 节 ) ， 作 为 仿 移 量 访问 页 目录 。 最 
终 ， 处 理 絮 从 物理 地 址 00005008 处 取得 页 表 的 物理 地 址 0x08001000。 


线性 地 址 的 中 间 10 位 为 二 进 制 的 0000000001， 即 0x001， 处 理 器 要 
用 它 作 为 页 表 内 的 索引 来 取得 页 的 物理 地 址 。 处 理 需 将 访 索 引 值 乘 以 4， 
作为 偏 移 量 访问 页 表 。 最 终 ， 处 理 嚣 又 从 物理 地 址 08001004 处 取得 页 的 
物理 地 址 ， 这 束 是 我 们 一 直 努 力 寻 找 的 那个 页 。 

页 的 物理 地 址 是 0x0000C000， 而 线性 地 址 的 低 12 位 是 数据 所 在 的 
页 内 偏 移 量 。 故 处 理 帮 将 它们 相 加 ， 得 到 物理 地 址 0x0000C050， 这 束 古 
线性 地 址 0x00801050 所 对 应 的 物理 地 址 ， 要 访问 的 数据 就 在 这 里 。 


注意 ， 这 种 变换 不 是 无 缘 无 故 的 ， 而 是 事先 安排 好 的 。 当 任务 加 载 
时 ， 操 作 系 统 先 创建 虚拟 的 段 ， 并 根据 段 地 址 的 高 20 位 决定 它 要 用 到 哪 
些 页 目录 项 和 页 表 项 。 然 后 ， 寻 找 空 闲 的 页 ， 将 原本 应 该 写 入 段 中 的 数 
据 写 到 一 个 或 者 多 个 页 中 ， 并 将 页 的 物理 地 址 填写 到 相应 的 页 表 项 中 。 
只 有 这 样 做 了 ， 当 程序 运行 的 时 候 ， 才 能 以 相反 的 顺序 进行 地 址 变换 ， 
并 找到 正确 的 数据 。 

检测 点 16.1 


在 分 页 模式 下 ， 某 程序 运行 时 ， 段 部 件 发 出 一 个 线性 地 址 
0x0C005032 访问 内 存 数 据 。 如 果 该 线性 地 址 对 应 的 物理 页 是 
0x0000A000， 页 表 的 物理 地 址 是 0x00003000， 那 么 ， 操 作 系 统 在 此 程 
序 开始 运行 前 ， 是 如 何 安 排 与 该 线性 地 址 相关 的 页 目录 项 和 页 表 项 的 ? 


16.2 本章 代码 清单 





16.3 ”使 内 核 在 分 页 机 制 下 工作 
16.3.1 创建 内 核 的 页 目录 表 和 页 表 


必须 说 明 的 是 ， 必 须 在 保护 栋 式 下 才能 局 动 页 功能 。 和 和 往 币 一 样 ， 
自 先 进入 你 护 柑 式 执 行 的 是 内 核 程序 ， 和 而且， 我 们 要 先 让 内 核 在 分 页 机 
制 下 工作 。 

本 章 依 然 没 有 提供 新 的 主 引 导 程 序 ， 这 意味 看 ， 还 要 用 以 前 的 主 引 
叶 程 序 ， 同 时 还 意味 看 ， 内 核 程序 的 足 体 结构 没有 变化 ， 人 否则 主 引 导 程 
序 义 怎么 可 能 投 往 第 的 方式 加 载 它 呢 。 

内核 的 入 口 点 是 在 代码 清单 16-1 的 第 884 行 ， 即 标号 "start 处。 换行 
到 这 里 的 时 候 ， 主 引导 程序 已 经 创建 了 内 核 的 大 部 分 要 系 : 全 局 描述 符 
表 (GDT) 、 公 共 例 程 段 、 内 核 数 据 段 、 内 核 代 人 码 段 、 内 核 栈 ， 偿 包括 
一 个 用 于 访问 全 部 4GB 内 存 空间 的 段 。 

内 核 的 忌 体 结构 和 它 在 内 存 中 的 布局 ， 从 第 14 章 以 来 束 没 什么 变 
化 ， 而 且 第 14 草 还 冒 经 给 出 了 一 幅 内 核 的 内 存 布局 图 。 为 了 方便 ， 这 里 
用 太一 种 形 却 再 次 展示 一 下 ， 如 几 16-9 所 示 。 


文本 模式 显示 缓冲 区 
(选择 子 : 0x20) 
000B8000 


内 核 代码 段 〈 选 择 子 : 0x38) 
内 核 数据 段 〈 选 择 子 : 0x30) 
公共 例 程 段 〈 选 择 子 : 0x28) 





00040000 


全 局 描述 符 表 GDT 
00007E00 
初始 化 代码 段 
( 主 引 导 程 序 ) 
00007C00 


系统 核心 栈 
(选择 子 : 0x18) 


| | 


图 16-9 内 核 加 载 之 后 的 内 存 布局 图 


其 中 ， 各 个 段 在 内 存 中 的 位 置 、 段 描述 符 和 摘 述 符 的 选择 子 ， 都 没 
有 变化 ， 可 以 和 前 面 的 章节 对 照 一 下 。 强 调 这 些 ， 只 是 要 表明 ， 即 使 是 
在 分 页 机 制 下 工作 ， 对 以 往 的 代码 和 内 存 分 配 都 没有 什么 影 啊 。 

接着 回 到 代码 清单 16-1 中 来 。 

第 885 一 889 行 ， 令 段 寄 存 器 DS 和 ES 分 别 指向 内 核 数 据 段 与 0 一 
4GB 数据 段 ， 以 方便 后 面 的 操作 。 

第 891、892 行 ， 在 屏幕 上 时 示 第 一 个 字符 串 ， 表 明 当 前 正在 内 核 中 
执行 ， 而 且 是 在 保护 模式 下 工作 。 

第 895 一 921 行 ， 在 屏幕 上 显示 处 理 器 的 品牌 信息 ， 这 段 代 码 和 往常 
一 样 ， 没 有 任何 变化 。 


0 一 4GB 数 据 段 《选择 子 : 0x08) 





00006C00 


接 下 来 的 工作 是 准备 开局 页 功能 ， 首 先 必 须 创 建 页 目录 和 页 表 。 每 
个 任务 部 有 自己 的 页 目录 和 页 表 ， 内 核 也 不 例外 ， 尺 官 它 是 为 所 有 任务 
所 共有 的 ， 但 也 包括 作为 任务 而 独立 存在 的 部 分 ， 以 执行 必要 的 系统 管 
理工 作 。 因 此 ， 要 想 内 核 正 第 运行 ， 必 须 创 建 它 目 己 的 外 目录 和 页 表 。 


肪 烦 在 于 ， 内 核 已 经 加 载 完 第 ， 它 的 所 有 部 分 部 已 经 位 于 内 存 中 。 
当然 ， 你 可 能 会 间 ， 这 上 怎么 会 是 个 麻烦 事 呢 ? 原 因 是 ， 在 一 个 理想 的 分 
页 系统 中 ， 要 加 载 程序 ， 必 须 和 完 搜 索 可 用 的 页 ， 并 将 它们 与 段 对 应 起 
来 。 在 这 种 情况 下 ， 段 部 件 输出 的 线性 地 址 和 页 部 件 输出 的 物理 地 址 不 
同 ， 征 很 目 然 的 事 ， 因 为 一 切 都 肥 生 在 程序 加 载 完 半 、 段 和 页 已经 有 了 
确定 的 映 册 关系 之 后 。 在 这 种 情况 下 ， 页 功能 开局 之 后 ， 各 方 部 能 很 好 
地 适应 。 


然而 ， 由 于 内 核 是 在 开局 页 功能 之 前 加 载 的 ， 段 在 内 存 中 的 位 置 已 
经 固定 。 在 这 种 情况 下 ， 即 使 开启 了 页 功能 ， 线 性 地 址 也 必须 和 物理 地 
址 相同 才 行 。 比 如 ， 在 开局 页 功能 之 前 ，GDT 在 内 存 中 的 基地 址 是 
0x00007E00， 它 就 是 全 局 描述 符 表 的 物理 地 址 ， 段 部 件 输出 的 线性 地 址 
就 是 物理 地 址 。 在 开局 页 功能 之 后 ， 它 还 在 那个 内 存 位 置 ， 这 就 要 求 页 
部 件 输出 的 物理 地 址 和 段 部 件 输出 的 线性 地 址 相同 。 一 句 话 ， 要 求 线性 
地 址 等 于 物理 地 址 才 行 。 


注意 ， 进 入 分 页 模式 之 后 ， 所 有 东西 的 地 址 都 成 了 线性 地 址 ， 包 括 
GDT、LDT 和 TSS 的 地 址 ， 等 等 。 


其 实 这 也 好 办 。 


不 像 流行 的 操作 系统 ， 我 们 的 内 核 非 党 小 ， 这 是 没有 办 法 的 事 ， 我 
们 的 任务 不 是 写 一 个 操作 系统 ， 能 说 明 问 题 即 可 。 也 正 是 因为 我 们 的 内 
核 很 小 ， 所 以 低 端 1MB 的 空间 对 它 来 说 已 经 绰绰有余 了 。 如 此 一 来 ， 我 
们 只 需要 将 低 端 1MB 内 存 特 殊 处 理 ， 使 这 一 部 分 内 存 的 线性 地 址 和 经 过 
页 部 件 转换 之 后 的 物理 地 址 相同 即 可 。 这 样 做 的 好 处 是 ， 内 核 不 用 做 任 
何 变 动 即 可 在 分 页 机 制 下 正常 工作 。 


对 页 目录 和 页 表 在 内 存 中 的 位 置 没 有 什么 限制 ， 在 哪里 部 行 ， 前 所 
征 属于 有 效 的 可 用 内 存 范围 ， 如 条 只 安 痕 了 1GB 的 物理 内 存 ， 而 想 把 页 
目录 放 到 2GB 的 位 置 ， 和 古 不 行 鸭 。 而 且 ， 页 目录 和 页 表 必 须 各 目 丘 用 一 
个 目 然 页 ， 也 就 是 说 ， 它 们 的 物理 地 址 的 低 介 位 必须 全 是 零 。 


在 页 目录 中 ， 一 个 目录 项 对 应 大 一 个 页 表 ， 而 一 个 页 表 可 以 容纳 
1024 个 页 ， 也 就 是 4MB 内 存 。 所 以 ， 对 于 内 核 来 说 ， 只 需要 一 个 页 表 就 
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行 了 ， 还 用 不 完 。 这 就 是 
说 ， 一 个 页 目录 和 一 个 页 表 
就 足够 了 。 

再 来 看 图 16-9， 在 GDT 
和 内 核 加 载 的 区 域 之 间 ， 是 
一 卢 空 日 。 因 此 ， 我 们 可 以 
将 内 核 的 页 目录 表 放 在 物理 
地 址 0x00020000 处 ;而 把 
内 核 的 第 一 个 页 表 放 在 物理 
地 址 0x00021000 处 。 此 
时 ， 新 的 低 端 1MB 内 存 布局 
就 如 图 16-10 所 示 了 。 


既然 我 们 的 目的 清楚 
I 炒 
么 ， 回 到 代码 清单 16-1， 先 
来 创建 页 目录 表 和 页 表 。 

第 927 一 933 行 ， 访 问 
段 寄 存 器 ES 所 指 问 的 4GB 
数据 段 ， 用 0x00020000 作 
为 偏 移 量 ,访问 页 目录 ， 将 
所 有 目录 项 清 零 。 


如 图 16-11 所 示 ， 这 是 
页 目录 项 和 页 表 项 的 格式 。 
可 以 看 出 ， 在 页 目录 和 页 表 
中 ， 只 保存 了 页 表 或 者 页 物 


图 16-10 “加 入 页 目录 和 页 表 后 的 低 端 1MB 内 存 布局 理 地 址 的 高 20 位 。 原 因 很 简 


单 ， 页 表 或 者 页 的 物理 地 


址 ， 都 要 求 必 须 是 4KB 对 齐 的 ， 以 便于 放 在 一 个 页 内 ， 故 其 低 12 位 全 是 
零 。 在 这 种 情况 下 ， 可 以 只 关心 其 高 20 位 ， 低 12 位 安排 其 他 用 途 。 
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(a) 页 目录 项 


1 9 





(b) 页 表 项 


图 16-11 页 目录 项 和 页 表 项 的 组 成 


eP (Present) 是 存在 位 ， 为 "1 时 ， 表 示 页 表 或 者 页 位 于 内 存 中 。 
侍 则 ， 表 示 页 表 或 者 页 不 在 内 存 中 ， 必 须 先 予以 创建 或 者 从 磁盘 调 入 
内 存 后 方 可 使 用 。 

eRW (Read/Write〉 是 读 / 写 位 。 为 “0” 时 表示 这 样 的 页 只 能 读 取 ， 为 
“4”? 时， 可 读 可 写 。 

eUS (User/Supervisor) 是 用 户 /管理 位 。 为 “1 时 ， 人 允许 所 有 特权 级 
列 的 程序 访问 ;为 "0" 时 ， 只 人 允许 特权 级 别 为 0、1 和 2 的 程序 访问 ， 特 权 
级 别 为 3 的 程序 不 能 访问 。 

e PWT (Page-level Write-Through ) ee 和 局 速 缓存 有 
关 。“ 通 写 " 是 处 理 器 高 速 缓存 的 一 种 工作 方式 ， 这 一 位 用 来 间接 决定 是 否 
pe 页 面 的 访问 效率 。 由 于 高 大 缓存 的 知识 1 将 在 下 册 中 

， 上 所 以 在 本 草 中 该 位 直接 清 雯 。 


e PCD (Page-level Cache Disable) 是 页 级 高 速 缓存 禁止 位 ， 用 来 
间接 决定 该 表 项 所 指 同 的 那个 页 是 否 使 用 噩 速 绥 存 策略 。 同 样 ， 在 本 草 
中 ， 该 位 将 被 清 零 ; 

e A (Accessed) 是 访问 位 。 该 位 由 人 处理 器 固件 设置 ， 用 来 指示 此 表 
项 所 指 癌 的 页 是 否 被 访问 过 。 这 一 位 很 有 用 ， 可 以 被 操作 系统 用 来 监视 
页 的 使 用 频率 ， 当 内 存 空间 紧张 时 ， 用 以 将 较 少 使 用 的 页 换 出 到 磁盘 ， 
同时 将 其 P 位 清 零 。 然 后 ， 将 释放 的 页 分 配给 号 上 就 要 运行 的 程序 ， 以 
实现 虚拟 内 存 管理 功能 

eD (Dirty) 是 脏 位 。 该 位 由 处 理 器 固件 设置 ， 用 来 指示 此 表 项 所 指 
器 的 页 是 否 写 过 数据 。 

e PAT (Page Attribute Table) 页 属性 表 文 持 位 。 此 位 涉及 更 复杂 的 
分 页 系统 ， 和 页 高 速 缓存 有 关 ， 可 以 不 予 理会 ， 在 普通 的 4KB 分 页 机 制 


中 ， 处 理 耸 建议 将 其 置 "0”。 


eG (Global) 征 全 局 位 。 用 来 指示 该 表 项 所 指 同 的 页 是 合 为 全 局 性 
质 的 。 如 条 页 是 全 局 的 ， 那 么 ， 它 将 在 高 速 缓存 中 一 直 保 存 〈 也 驳 意 味 
看 地 址 转换 速度 会 很 快 ) 。 因 为 页 局 速 绥 存 容量 有 限 ， 只 能 存放 频 崇 使 
用 的 那些 未 项 。 而 且 ， 当 因 任 务 切 换 等 原因 改变 CR3 寄存 更 的 内 容 时 ， 
整个 页 高 速 缓存 的 内 容 都 会 刷新 。 


eAVL 位 被 处 理 器 忽略 ， 软 件 可 以 使 用 。 
回 到 代码 清单 16-1 中 来 。 


将 页 目录 清 零 的 原因 ， 主 要 是 使 所 有 目录 项 的 P 位 为 “0”"。 目 录 项 用 
于 定位 对 应 的 页 表 ， 如 果 其 P 位 是 "0"， 表 明 访 页 表 并 不 在 内 存 中 ， 在 地 
址 变换 时 将 引 及 处理 硕 异种 中 源 。 


在 建立 了 一 个 为 空 的 页 目录 表 之 后 ， 第 936 行 ， 将 页 目录 表 的 物理 
地 址 登记 在 它 目 己 的 最 后 一 个 目录 项 内 。 页 目录 最 大 4KB， 最 后 一 个 目 
录 项 的 偏 移 量 是 0xFFC， 即 十 进 制 数 4092。 页 目录 需要 频繁 地 进行 修 
改 ， 为 了 方便 用 线性 地 址 访问 页 目录 表 目 号 ， 需 要 使 用 这 项 技术 ， 蕊 上 
我 们 束 要 讲 到 。 注 章 ， 填 写 的 内 容 是 0x00020003， 访 数值 的 前 20 位 是 
物理 地 址 的 高 20 位 ; P= 二 1， 页 是 位 于 内 存 中 的 ; RW 二 1， 该 日 录 项 指 问 
的 页 表 可 读 可 写 。 还 要 注意 到 ，US 位 是 “0"， 故 此 目录 项 指向 的 页 表 不 
允许 特权 级 为 3 的 程序 和 任务 访问 。 

注意 ， 这 将 浪 恤 一 个 页 目录 表 项 ， 同 时 使 得 最 噩 问 的 4MB 内 存 无 法 
访问 〈0xFFC00000~0xFFFFFFFF) 。 不 过 ， 即 使 不 浪费 ， 一 般 的 软件 
也 不 会 涉足 这 个 区 域 。 

如 图 16-12 所 示 ， 内 核 占 用 看 内 存 的 低 问 1MB， 线 性 地 址 范围 是 
0x00000000 一 0x000FFFFF， 共 256 个 4KB 页 ， 占 用 了 页 目录 表 的 第 1 
个 目录 项 ， 以 及 该 目录 项 下 属 页 表 的 前 256 个 页 表 项 。 第 939 行 ， 修 改 
页 目录 内 第 1 个 日 录 项 的 内 容 ， 使 其 指 问 页 表 ， 页 表 的 物理 地 址 是 
0x00021000， 该 页 位 于 内 存 中 ， 可 读 可 写 ， 但 不 允许 特权 级 别 为 3 的 程 
序 和 任务 访问 。 


FPC 





a 
i 256 个 页 
256 个 表 项 
— i 


线性 地 址 范围 : 
000 上 - - J 0x00000000~0x000FFFFF 
图 16-12 ”内 核 所 占用 的 低 问 1MB 内 存 分 页 效果 图 


第 942 一 952 行 ， 将 内 存 低 端 1MB 所 包含 的 那些 页 的 物理 地 址 按 顺 
序 一 个 一 个 地 填写 到 页 表 中 ， 当 然 ， 仅 填写 256 个 页 表 项 。 第 1 个 页 表 项 
对 应 的 是 线性 地 址 0x00000000 一 0x00000FFF， 填 写 的 内 容 是 第 1 个 页 
的 物理 地 址 0x00000000; 第 2 个 页 表 项 对 应 的 是 线性 地 址 0x00001000 一 
0x00001FFF， 填 写 的 是 第 2 个 页 的 物理 地 址 0x00001000; 第 3 个 页 表 项 
对 应 的 是 线性 地 址 0x00002000 一 0x00002FFF， 填 写 的 是 第 3 个 页 的 物 
理 地 址 0x00002000，...... 。 如 此 一 来 ， 这 部 分 内 存 的 线性 地 址 瓯 和 物理 
地 址 一 样 了 。 

这 部 分 代码 还 是 很 容易 看 懂 的 ， 第 942 一 944 行 ， 用 EBX 寄存 器 指 
问 页 表 基 地 址 ; 用 EAX 寄存 器 保存 页 的 物理 地 址 ， 和 初始 为 0x00000000， 
每 次 按 0x1000 递增 ， 以 指 同 下 一 个 页 ;ESI 寄存 左 用 于 定位 每 一 个 页 表 
项 。 


参见 图 16-11， 因 为 页 的 物理 地 址 是 4KB 对 齐 的 ， 故 其 低 12 位 全 为 
零 ， 在 写 入 页 表 项 时 ， 仅 保存 它 的 前 20 位 ， 低 12 位 是 页 属性 。 在 实际 写 
入 每 个 页 表 项 之 前 ， 先 将 页 的 物理 地 址 转 存 到 EDX 寄存 器 ， 并 将 属性 值 
加 到 其 低 12 位 上 。 属 性 值 是 3， 故 P= 二 1，RW= 二 1;， US 一 0， 特权 级 别 为 3 
的 程序 和 任务 不 能 访问 这 些 页 。 


尤其 注意 第 948 行 的 指令 : 


mov [es:epbpx+es1lIx4] ,edqx 


再 重复 一 次 ， 请 务必 注意 ，32 位 处 理 器 允许 在 寻 址 时 使 用 一 个 倍率 
因子 ， 在 这 里 是 乘 以 4， 表 达 式 的 计算 不 在 编译 期 间 进行 ， 而 在 指令 执行 
的 时 候 进行 。 


页 表 的 前 256 个 表 项 填写 之 后 ，EBX 寄存 器 的 当前 值 是 256， 它 又 
被 用 于 第 955 一 958 行 ， 接 着 处 理 其 余 的 表 项 ， 使 它们 的 内 容 为 全 零 。 
即 ， 将 它们 置 为 无 效 表 项 。 


页 目录 和 页 表 都 已 创建 ， 它 们 的 表 项 也 都 安排 受 当 ， 第 961、962 
行 ， 将 页 目录 表 的 物理 基地 址 传送 到 控制 寄存 器 CR3， 也 就 是 页 目录 表 
基地 址 寄存 占 PDBR， 该 寄存 右 的 格式 如 图 16-13 所 示 。 


31 12 11 3 4 3 2 0 


图 16-13 ”控制 寄存 器 CR3 (PDBR) 的 组 成 


由 于 页 目录 表 必 须 位 于 一 个 目 然 页 内 ， 故 其 物理 基地 址 的 低 12 位 是 
全 零 ， 处 理 右 的 设计 者 认为 既然 如 此 ， 只 登记 它 的 蜗 20 位 即 可 。 低 12 
位 ， 除 了 PCD 和 PWT 位 外 ， 虱 没有 使 用 。 这 两 位 用 于 控制 页 目录 的 加 
速 缓存 特性 ， 请 参 申 前 面 的 解释 。 在 本 章 中 ， 为 了 方便 ， 这 两 位 一 律 为 


从 表面 上 看 ， 和 控制 寄存 器 有 关 的 传送 指令 和 普通 的 传送 指令 一 
样 。 实 际 上 ， 这 是 两 种 不 同类 型 的 指令 ， 操 作 码 是 不 一 样 的 。 控 制 寄存 
器 是 在 有 了 32 位 处 理 器 之 后 才 开始 出 现 的 ， 故 其 长 度 至 少 是 32 位 。 在 
32 位 处 理 器 上 ， 和 控制 寄存 器 有 关 的 传送 指令 ， 其 格式 为 ; 


mov CRO~~CRT ,£32 ;从 32 位 通用 寄存 器 传送 到 控制 寄存 器 
mov r32,CRO~CR7 ; 从 控制 寄存 器 传送 到 32 位 通用 寄存 器 


没 错 ， 最 新 的 处 理 絮 内 共有 8 个 控制 寄存 占 ， 从 CR0 到 CR7， 人 至 于 
它们 都 有 什么 用 ， 别 好 奇 ， 等 看 完 这 本 书后 ， 你 再 慢 慢 学 习 吧 。 汇 编 语 
言 的 一 个 缺点 是 无 法 区 分 不 同 指令 间 的 细微 兰 别 。 在 这 里 ， 尽 管 也 使 用 
了 助 记 符号 “mov”， 但 实际 上 ， 它 和 一 般 的 传送 指令 有 所 区 别 。 

看 来 全 都 准备 停 当 了 ， 现 在 就 开启 页 功能 。 如 图 16-14 所 示 ， 控 制 寄 
存 器 CR0 的 最 高 位 ， 也 就 是 位 31， 是 PG (Page) 位 ， 用 于 开启 或 者 关 


闭 页 芒 能 。 当 该 位 清 堆 时， 页 功能 航天 闭 ， 从 段 部 件 来 的 线性 地 址 融 是 
物理 地 址 ， 妆 它 兽 位 时 ， 页 功能 开局 。 只 能 在 你 护 模 式 下 才能 开局 贝 功 
能 ， 当 PE 位 消 零 时 〈 实 模式 ) ， 设 置 PG 位 将 导致 处 理 融 产 生 一 个 异 御 
中 断 。 
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图 16-14 控制 寄存 需 CRO 的 PG 位 


第 964 一 966 行 ， 先 谈 取 控制 寄存 左 CRO 的 原始 内 容 ， 然 后 ， 将 其 
最 高 位 置 “1”， 其 他 各 位 保持 原来 的 数值 不 变 。 接 着 ， 将 修改 后 的 内 容重 
新 传 回 CRO0 寄存 器 ， 这 直接 导致 处 理 器 工作 在 分 页 机 制 下 。 从 这 一 瞬间 
开始 ， 段 部 件 产 生 的 地 址 束 不 再 被 看 成 物理 地 址 ， 而 是 要 送 往 页 部 件 进 
行 变换 ， 以 得 到 真正 的 物理 地 址 。 


注意 ， 现 在 内 核 工作 在 分 页 机 制 的 一 个 特殊 情况 下 ， 即 ， 线 性 地 址 
和 经 过 页 部 件 转换 后 的 物理 地 址 相同 ， 这 是 精心 安排 后 的 结果 。 举 个 例 
子 ， 如 果 要 访问 全 局 描述 符 表 GDT 内 的 第 2 个 描述 符 。 在 开启 页 功能 之 
前 ，GDT 的 线性 地 址 是 0x00007E00， 第 2 个 描述 符 的 线性 地 址 则 是 
0x00007E08。 在 开启 页 功能 之 后 ， 依 然 要 保证 转换 后 的 物理 地 址 和 线性 
地 址 一 样 ， 仍 是 0x00007E00 和 0x00007E08。 好 ， 线 性 地 址 送 到 页 部 
件 ， 页 部 件 用 线性 地 址 的 高 10 位 在 页 目录 中 查找 页 表 ; 再 用 线性 地 址 的 
中 间 10 位 在 页 表 中 查找 页 。 经 过 转换 ， 找 到 了 包含 该 数据 的 页 ， 页 的 物 
理 地 址 是 0x00007000。 于 是 ， 将 页 地 址 和 线性 地 址 的 低 12 位 (0xE08) 
拼凑 在 一 起 ， 形 成 最 终 的 0x00007E00 和 0x00007E08。 


可 以 在 Bochs 中 用 "creg ”命令 察看 控制 寄存 器 CRO 和 CR3 的 内 容 ， 
具体 方法 请 参见 本 章 16.6.2 节 ; 也 可 以 输入 一 个 线性 地 址 ， 来 察看 它 所 
对 应 的 物理 页 ， 有 具体 方法 请 参见 本 章 16.6.3 节 ; 要 察看 当前 页 表 中 的 全 
部 内 容 ， 可 以 用 "info tab” 命 令 ， 请 参见 本 章 16.6.4 节 。 


16.3.2 ”任务 全 局 空间 和 局 部 空间 的 页 面 映 射 
和 往常 一 样 ， 接 下 来 的 工作 是 加 载 用 户 程序 ， 并 创建 一 个 任务 。 


每 个 任务 都 有 目 己 独立 的 4GB 虚拟 地 址 空间 。 这 话说 来 简单 ， 大 家 
也 都 能 在 理论 的 层面 上 理解 ， 但 从 来 没有 实现 过 ,今天 我 们 就 来 实践 一 
al。 

但 是 细 一 琢磨 ， 这 里 面 有 个 问题 。 


每 个 任务 都 有 自己 的 页 目录 表 和 页 表 ， 当 任务 创建 时 ， 它 们 一 同 被 
创建 。 当 任务 执行 时 ， 页 部 件 使 用 它们 访问 任务 自己 的 私有 内 存 空间 
(页 面 ) 。 但 是 ， 任 务 的 页 目录 表 和 页 表 不 能 只 包含 任务 的 私有 页 面 。 
如 果 不 是 这 样 ， 当 任务 调用 内 核 服 务 时 ， 或 者 换 名 话说， 进入 0 特权 级 的 
全 局 地 址 空间 执行 时 ， 地 址 转换 将 无 法 进行 ， 因 为 任务 的 页 目录 表 和 页 
表 里 疫 有 登记 内 核 所 占用 的 那些 物理 页 面 。 

还 记得 吗 ， 我 们 一 直 在 说 ， 任 务 的 4GB 地 址 空间 包括 两 个 部 分 : 局 
部 空间 和 全 局 空间 ， 全 局 空间 是 所 有 任务 共用 的 。 很 明显 ， 内 核 束 是 所 
有 任务 共用 的 ， 它 应 当 属 于 每 个 任务 的 全 局 空间 。 

一 般 来 说 ， 公 平 起 见 ， 全 局 地 址 空间 占据 着 任务 4GB 地 址 空间 的 高 
2GB， 对 应 的 线性 地 址 范围 是 0x80000000~0xFFFFFFFF; 而 局 部 地 址 
空间 则 使 用 低 2GB ， 对 应 的 线性 地 址 范围 是 0x00000000 一 
0x7FFFFFFF。 如 图 16-15 所 示 ， 地 址 空间 的 分 配 必 须 在 每 个 任务 的 页 目 
录 中 体现 ， 页 目录 的 前 半 部 分 指 问 任 务 自己 的 页 表 ; 后 半 部 分 则 指 问 内 
核 的 页 表 。 人 否则 的 话 ， 当 转 到 内 核 中 执行 时 ， 是 无 法 完成 地 址 转换 的 ， 
因为 找 不 到 对 应 的 目录 项 和 页 表 项 。 

在 任何 任务 内 ， 在 任何 时 候 ， 如 果 段 部 件 发 出 的 线性 地 址 高 于 等 于 
0x80000000， 指 回 和 访问 的 束 是 全 局 地 址 空间 ， 或 者 说 内 核 。 

为 此 ， 我 们 要 修改 内 核 目 己 的 页 目录 表 ， 甚 至 是 内 核 各 个 段 的 摘 述 
伯 ， 将 内 核 挪 到 虚拟 地 址 空间 的 高 疾 ， 也 就 是 虚拟 地 址 空间 中 ， 从 
0x80000000 开始 的 一 段 连续 区 域 。 也 许 你 并 未 安装 这 么 多 物理 内 存 ， 但 
是 ， 没 有 关系 ， 我 都 说 了 ， 这 是 线性 地 址 空间 ， 或 者 叫 虚 拟 地 址 空间 。 

如 图 16-16 所 示 ， 这 是 映射 到 虚拟 内 存 高 问 地 址 后 的 内 核 布局 图 。 


任务 的 页 目录 区 


FFG 


512 个 目录 项 ， 对 
应 着 当前 任务 的 
2GB 局 部 地 址 空间 





000 


任务 自己 的 页 表 





图 16-15 ”通过 页 目录 和 页 表 来 实现 地 址 空间 的 分 配 


文本 模式 显示 缓冲 区 
800B8000 


系统 核心 程序 和 数据 
80040000 

全 局 描述 符 表 GDT 
80007E00 


80007C00 


系统 核心 栈 
80006C00 


图 16-16 ”映射 到 高 病 地 址 后 的 系统 核心 布局 


第 969 一 973 行 ， 在 内 核 的 页 目录 表 中 ， 创建 一 个 和 线性 地 址 
0x80000000 对 应 的 目录 项 ， 并 使 它 指 同 同一 个 页 表 。 毕 葛 ， 我 们 只 改变 
了 线性 地 址 空间 范围 ， 内 核 的 数据 和 代码 仍然 在 原来 的 页 内 ， 没 有 改 
变 。 

为 了 修改 页 目录 表 PDT， 需 要 访问 它 ， 知 道 它 的 物理 地 址 。 但 是 ， 
当前 已 经 开启 了 分 页 功能 ， 在 分 页 机 制 下 ， 程 序 只 能 使 用 线性 地 址 ， 访 
问 内 存 必 须 先 访问 页 目录 和 页 表 ， 通 过 它们 转换 之 后 的 地 址 才 是 能 够 发 
送 到 内 存 芯 片 的 物理 地 址 ， 你 自己 知道 页 目录 表 的 物理 地 址 ， 这 没有 
用 。 或 者 ， 说 得 更 清楚 一 点 ， 你 访问 的 是 页 目录 表 ， 但 却 还 要 通过 页 目 
录 表 进行 地 址 转换 之 后 才能 访问 内 存 中 的 页 目录 表 。 这 有 点 目 相 矛盾 ， 





除非 页 目录 表 中 有 一 个 目录 项 能 指 同 页 目录 表 目 己 。 人 否则 ， 访 问 一 个 并 
未 在 页 目录 表 和 页 表 内 登记 的 页 ， 会 引 友 处 理 奉 开 帅 中断 。 


这 段 代 人 码 ， 其 实 倒 过 来 ， 先 从 结果 看 手 可 能 更 容易 理解 。 经 过 分 析 
可 知 ， 当 第 973 行 的 指令 
mov dword [es:ebxtesi],0x00021003 


执行 时 ，ES 是 指 回 0 一 4GB 内 存 段 的 ，EBX 寄存 右 的 内 容 为 
0xFFFFF000，ESI 寄存 器 的 内 容 为 0x00000200， 因 此 ， 段 部 件 发 出 的 
线性 地 址 是 0xFFFFF200。 

如 图 16-17 所 示 ， 当 前 程序 或 者 任务 的 页 目录 表 ， 其 物理 基地 址 是 由 
控制 寄存 器 CR3 指示 的 ， 仅 高 20 位 有 效 ， 是 多 少 并 不 重要 ， 可 以 假定 为 
0x?????000。 段 部 件 产 生 的 线性 地 址 是 0xFFFFF200， 其 高 10 位 的 值 是 
0x3FF， 这 个 值 乘 以 4， 结 果 为 0xFFC。 这 个 值 同 CR3 寄存 器 提供 的 页 目 


录 项 的 物理 地 址 。 从 此 处 取出 一 个 双 字 ， 束 是 线性 地 址 0xFFFFF200 所 
对 应 中 表 的 物理 地 址 。 


UN 1111111111 001000000000 


Ox3FF x4 


ga ret wl 机具 是 全 -vie ee > FFC 


图 16-17 使 用 线性 地 址 访问 和 修改 页 目录 表 〈 图 示 一 ) 


有 趣 的 是 ， 在 前 面 第 936 行 ， 我 们 已 经 在 该 目录 项 内 填写 了 页 目录 
表 的 物理 基地 址 。 因 此 ,该 目录 项 所 指 癌 的 页 表 正 是 当前 的 页 目录 表 目 


己 ， 这 实际 上 是 把 页 目录 表 当 成 页 表 来 用 。 
接 下 来 ， 如 图 16-18 所 示 ， 处 理 器 用 线性 地 址 0xFFFFF200 的 中 间 
10 位 作为 偏 移 量 访问 页 表 ， 这 10 位 的 值 是 0x3FF。 页 表 的 物理 地 址 就 是 


它 就 是 页 表 内 最 后 一 个 页 表 项 的 物理 地 址 。 从 此 处 取出 一 个 双 字 ， 就 是 
线性 地 址 0xFFFFF200 所 在 的 那个 页 的 物理 地 址 。 


0x3FFX4 


页 目录 表 (做 页 表 用 ) 


Des > FFC 


页 才 的 物 通 基 地 址 





图 16-18 使 用 线性 地 址 访问 和 修改 页 目录 表 〈( 图 示 二 ) 


因为 访问 的 又 是 同一 内 存 位置 ， 故 最 终 要 访问 的 页 仍 是 页 目录 表 自 
000， 页 内 偏 移 由 线性 地 址 的 低 12 位 乘 以 4 给 出 ， 其 值 为 0x800。 所 以 ， 
当 指 令 


1111111111 | 001000000000 


页 目录 表 《 做 页 用 ) 


Ox200X4 


写 为 0x00021003 -一 





页 的 物理 基地 址 a 


ny = 
ne 


图 16-19 ”使 用 线性 地 址 访问 和 修改 页 目录 表 (图 示 三 


mov dword [es:ebxtesi],0x00021003 


执行 时 ， 人 处理 器 发 出 的 物理 地 址 是 0x?????800， 并 将 该 双 字 单元 的 内 容 
改写 为 0x00021003。 


综合 上 面 的 分 析 ， 这 就 是 说 ， 如 果 页 目录 表 的 最 后 一 个 目录 项 指 同 
当前 页 目录 表 自 己 ， 那 么 ， 无 论 任 何 时 候 ， 当 线性 地 址 的 高 20 位 是 
0xFFFFF 时 ， 访 问 的 就 是 页 目录 表 目 己 。 


修改 页 目录 表 的 原理 就 是 这 样 。 因 此 ， 当 我 们 回 过 涉 去 看 时 ， 第 969 
行 ， 实 际 上 给 出 了 当前 正在 使 用 的 页 目录 表 的 线性 基地 址 0xFFFFF000，; 
第 970 行 ， 给 出 了 要 修改 的 那个 目录 项 所 对 应 的 线性 基地 址 ， 其 高 10 位 
的 值 乘 以 4， 决 定 了 该 线性 地 址 所 对 应 的 页 目录 表 内 偏 移 量 。 因 此 ， 第 
971 行 ， 将 线性 地 址 右 移 22 位 ， 只 保留 高 10 位 ， 第 972 行 ， 再 将 它 左 移 
2 位 ， 相 当 于 乘 以 4。 


取 终 ， 页 目录 表 内 有 两 个 目录 项 部 指 问 同 一 个 页 表 ， 如 图 16-20 所 
示 。 不 过 ， 尽 管 指 同 的 是 同一 个 页 表 ， 这 两 个 目录 项 所 映射 的 线性 地 址 


是 不 一 样 的 ， 旧 表 项 依然 对 应 痢 线 性 地 址 0x00000000 一 0x000FFFFF; 
新 表 项 则 对 应 着 一 个 高 端的 地 址 范围 0x80000000 一 0x800FFFFF。 


这 回 ， 你 应 该 很 清楚 了 ， 为 什么 处 理 器 会 使 用 层次 化 的 分 页 结构 ， 
而 不 是 用 4MB 内 存 组 建 单一 的 页 映射 表 。 如 果 采 用 后 者 ， 将 不 得 不 至 少 
保留 2MB 的 内 存 空 间 。 当 然 ， 这 对 于 现在 的 计算 机 来 说 算 不 了 什么 ， 但 
是 ， 在 1978 年 ，80386 处 理 问 刚刚 问 所 的 时 候 ， 拥 有 2MB 物理 内 存 还 
是 一 种 非常 奢侈 的 想法 。 即 使 是 在 15 年 之 后 的 1993 年 ， 在 我 使 用 的 计 
算 机 上 也 才 有 2MB 物理 内 存 ， 已 经 是 相当 不 错 的 ， 那 台 计 算 机 花 了 7000 
多 元 人 民 币 。 

仅仅 修改 页 目录 表 是 没有 用 的 ， 如 果 段 部 件 给 出 的 线性 地 址 并 不 在 
0x80000000 以 上 ， 是 没有 用 的 。 因 此 ， 必 须 修 改 与 内 核 有 关 的 段 描 述 
符 ， 包 括 全 局 描述 符 表 (GDT) 自己 的 线性 地 址 。 一 旦 开启 页 功能 ， 除 
页 目录 表 和 页 表 的 地 址 外 ， 其 他 所 有 地 址 都 是 线性 地 址 ， 即 使 是 在 访问 
GDT 和 LDT 的 时 候 ， 内 核 就 更 不 用 说 了 ， 不 可 能 因为 它 靠近 硬件 就 能 摘 
特殊 。 

修改 段 描述 符 很 简单 ， 只 需要 将 其 中 的 基地 址 部 分 加 上 0x80000000 
即 可 。 比 如 GDT， 原 先 的 地 址 是 0x00007E00 ， 现 在 则 要 改 为 
0x80007E00。 说 起 来 容易 做 起 来 难 ， 段 描述 符 中 的 基地 址 不 是 连续 的 ， 
处 于 高 低 两 个 双 字 中 的 不 同位 置 ， 重 新 计算 比较 态 烦 。 
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线性 地 址 范围 : 
Ox00000000~0x000FFFFF 


0x80000000~0x800FFFFF 
图 16-20 ”将 内 核 映 射 到 高 问 地 址 后 的 页 目录 表 


驻 运 的 是 ，0x80000000 是 一 个 有 趣 的 数 ， 仅 最 高 位 是 “1 ， 其 余 31 
比特 都 是 "0"。 因 此 ， 只 需要 访问 全 局 描述 符 表 (GDT) ， 将 所 有 摘 述 符 
高 字 部 分 的 最 高 位 置 “ 人 即 可 。 

第 977 一 979 行 ， 先 取得 GDT 的 线性 基地 址 ， 并 传送 到 EBX 寄存 
器 ， 准 备 开 始 访问 GDT 内 的 段 描述 符 。 

第 981 一 986 行 ， 依 次 找到 内 核 栈 段 、 文 本 模式 下 的 视频 缓冲 区 有 段 、 
公共 例 程 段 、 内 核 数据 段 和 内 核 代 码 段 的 描述 符 ， 并 将 每 个 描述 符 的 最 
局 位 改 成 “1”。 在 这 里 ，EBX 寄存 需 提 供 了 GDT 的 基地 址 ; 0x10、 
0x18、0x20 等 这 些 数 提 供 了 每 个 描述 符 在 表 内 的 偏 移 量 ; 在 含 移 量 的 基 
础 上 加 4， 就 是 每 个 描述 符 的 高 32 位 。 唯 一 没有 修改 的 是 0 一 4GB 内 存 段 
的 描述 符 ， 它 本 里 束 是 为 访问 整个 内 存 空 间 而 存在 的 ， 不 需要 修改 。 

尽管 全 局 描述 符 表 (GDT) 很 重要 ， 但 处 理 器 不 会 对 它 有 任何 照 
顾 ， 开 局 分 页 功能 后 ， 访 问 GDT 也 同样 需要 使 用 线性 地 址 。 因 此 ， 第 
988 行 ， 将 GDT 的 基地 址 映射 到 内 存 的 高 器， 即 加 上 0x80000000。 第 
990 行 ， 将 修改 后 的 GDT 基地 址 和 界限 值 加 载 到 全 局 描述 符 表 寄 存 器 
(GDTR) ， 使 修改 生效 。 





我 知道 ， 很 多 人 会 有 一 个 疑问 : 在 修改 段 描述 符 的 时 候 ， 以 及 重新 
设 定 了 GDT 基地 址 的 时 候 ， 会 不 会 导致 程序 的 执行 出 现 问 题 ， 毕 葛 访 问 
内 存 需 要 先 访 问 GDT， 然 后 访问 GDT 内 的 描述 符 ， 而 你 已 经 改变 了 它 
们 ]。 

答案 是 不 会 。 在 你 能 够 访问 GDT， 或 者 能 够 修改 描述 符 的 时 候 ， 段 
寄存 器 CS、SS、DS、ES、FS 和 GS 已 经 指向 了 相应 的 段 ， 对 不 对 ? 

那么 ， 我 们 知道 ， 段 寄存 器 实际 上 由 段 选择 器 和 描述 符 高 速 缓存 器 
组 成 。 当 取 指 令 和 执行 指令 时 ， 或 者 访问 内 存 中 的 数据 时 ， 处 理 器 不 会 
每 次 都 重新 加 载 段 寄存 器 ， 而 是 使 用 CS、SS、DS、ES、FS 和 GS 描述 
符 高 速 缓存 器 中 的 内 容 。 


所 以 ， 当 你 改变 了 GDT 的 基地 址 ， 或 者 修改 了 段 摘 述 符 之 后 ， 这 些 
修改 不 会 立即 反映 到 上 段 寄存 占有 的 插 述 从 局 速 组 和 存 桌 ， 对 程序 的 运行 没有 
任何 影响。 

但 是 ， 当 执行 一 个 段 间 转 移 指令 ， 或 者 往 段 寄存 右 里 加 载 一 个 新 的 
段 插 述 从 选择 子 时 ， 处 理 此 将 会 访问 GDT 或 者 LDT， 并 刷新 段 寄存 右 拍 
述 符 高 速 缓存 耸 的 内 容 。 因 此 ， 为 了 使 处 理 融 欧 移 到 内 存 的 高 姗 位 置 执 
行 ， 需 要 显 却 地 刷新 段 寄 人 存 大 的 内 容 。 


代码 段 寄 存 需 CS 的 刷新 一 般 使 用 转移 指令 完成 。 因 此 ， 第 992 行 ， 
使 用 远 转 移 指令 jmp 跳 转 到 下 一 条 指令 的 位 置 接 着 执行 。 这 将 导致 处 理 
人 费用 新 的 段 描 述 从 选择 子 core_code_seg_sel (0x38) 访问 GDT， 从 中 
取出 修改 后 的 内 核 代 码 段 摘 述 符 ， 并 加 载 到 其 描述 符 高 速 绥 存 右 中 。 同 
时 ， 这 也 直接 导致 处 理 器 开始 从 内 存 的 高 端 位 置 取 指令 执行 。 

第 995 一 999 行 ， 重 新 加 载 段 寄 存 右 SS 和 DS 的 摘 述 符 高 速 缓存 
右 ， 使 它们 的 内 容 变 成 修改 后 的 数据 段 描述 符 。 注 站 ， 这 些 段 在 内 存 中 
的 物理 位 置 并 没有 改变 。 特 别 是 栈 段 ， 因 为 仅仅 是 线性 地 址 变 了 ， 栈 在 
内 存 中 的 物理 位 置 并 没有 发 生变 化 ， 所 以 栈 指针 寄存 器 ESP 仍 指 同 正确 
的 位 置 。 段 寄存 器 ES 没有 修改 ， 因 为 它 指 同 整 个 0 一 4GB 内 存 段 ， 内 核 
需要 有 访问 整个 内 存 空间 的 能 力 。 段 寄存 器 FS 和 GS 没有 使 用 。 

第 1001、1002 行 ， 显 示 一 条 消息 ， 告 诉 屏 幕 前 的 人 ， 已 经 开局 了 分 
页 功能 ， 而 且 内 核 已 经 被 映射 到 线性 地 址 0x80000000 以 上 。 需 要 特别 说 
明 的 是 ， 即 使 是 在 分 页 机 制 下 ， 相 对 于 上 一 半 ， 过 程 put_string 及 其 藤 套 
过 程 put_char 也 没有 做 任何 修改 ， 但 依然 工作 得 很 好 。 原 因 很 简单 ， 尺 
管 文本 模式 的 显示 缓冲 区 基地 址 已 经 映射 到 一 个 较 高 的 地 址 


0x800B8000 ， 但 是 ， 同 该 区 域内 的 任何 一 个 单元 ， 比 如 线性 地 址 
0x800B8020 写字 符 时 ， 页 部 件 最 终 会 在 页 表 内 找到 显示 绥 冲 区 所 在 的 
那个 页 ， 页 的 物理 地 址 是 0x000B8000。 用 页 的 物理 地 址 加 上 12 位 的 页 
内 的 偶 移 量 0x020， 就 是 最 终 的 物理 地 址 0x000B8020。 


第 1005 一 1023 行 ， 安 竣 供 用 户 程序 使 用 的 调用 门 ， 并 显示 安 儿 成功 
的 少 轧 。 这 一 段 代 反 和 上 一 草 相 同 ， 没 有 做 任何 修改 。 门 描述 符 只 水 
目标 代码 段 的 选择 子 和 侦 移 量 ， 但 是 你 应 访 清 茎 ， 目 标 代 但 实际 上 已 经 
被 映射 到 闪存 的 高 闯 了 。 


16.4 创建 内 核 任 务 


16.4.1 内 核 的 虚拟 内 存 分 配 


接 下 来 的 工作 是 使 内 核 的 一 部 分 成 为 任务 ， 并 为 创建 用 户 任 务 和 实 
施 任务 切换 做 准备 。 


首先 是 创建 内 核 任 务 的 任务 状态 段 (TSS) 。 内 核 的 主体 部 分 占据 
着 从 线性 地 址 0x80000000 开始 的 1MB 内 存 空间 ， 即 0x80000000 一 
0x800FFFFF ， 在 此 之 后 的 空间 ， 即 0x80100000 ~ 0xFFFFFFFF， 是 
可 以 目 由 分 配 的 。 


为 了 连续 地 、 动 态 地 分 配 内 核 的 空间 ， 内 核 需 要 记 住 下 一 个 可 用 于 
分 配 的 线性 地 址 。 为 此 ， 代 码 清单 16-1 的 第 529 行 ， 专 门 声 明了 标号 
core_next laddr， 并 初始 化 了 一 个 双 字 0x80100000， 这 吏 是 初始 的 可 分 
配 线性 地 址 。 每 当 分 配 了 新 的 内 存 空间 后 ， 该 双 字 将 修正 为 下 一 个 可 分 
配 的 地 址 。 


在 分 页 机 制 下 ， 内 存 的 分 配 既 要 在 虚拟 内 存 空间 中 进行 ， 还 要 在 页 
目录 表 和 页 表 中 进行 。 原 因 你 是 清楚 的 ， 线 性 地 址 最 终 要 通过 页 目录 表 
和 页 表 转 换 成 物理 地 址 ， 如 果 没 有 分 配 一 个 物理 页 ， 对 任何 内 存 的 访问 
者 是 无 效 的 ， 会 引发 处 理 器 异 币 中 新 。 

第 1026 行 ， 先 访问 内 核 数 据 段 ， 从 标号 处 取得 当前 可 用 的 线性 地 
址 ， 将 来 要 作为 内 核 TSS 的 起 始 线性 地 址 。 然 后 ， 将 EBX 寄存 器 中 的 线 
性 地 址 作为 参数 ， 调 用 过 程 alloc inst a_page 去 申请 一 个 物理 页 。 

该 过 程 位 于 第 358 行 ， 是 公共 例 程 段 内 的 过 程 ， 它 的 功能 是 在 可 用 
的 物理 内 存 中 搜索 空 亲 的 页 ， 并 将 它 安 闭 在 当前 的 层次 化 分 页 结构 中 
(页 目录 表 和 页 表 ) 。 人 简单 地 说 ， 台 是 寻找 一 个 可 用 的 页 ， 然 后 ， 根 握 
线性 地 址 来 创建 页 目录 项 和 页 表 项 ， 并 将 页 的 地 址 填 与 在 页 表 项 中 。 


该 过 程 首 先 察 看 与 该 线性 地 址 相对 应 的 页 目录 项 是 个 人 存在。 线性 地 
址 的 高 10 位 是 页 目录 表 的 索引 ， 将 该 值 缮 以 4， 束 是 当前 页 目 录 表 中 ， 
与 该 线性 地 址 对 应 的 页 目录 项 。 第 370 行 ， 将 EBX 寄 存 器 中 的 线性 地 址 
传送 到 ESI 寄存 器 作为 副本 ; 第 371 行 ， 用 AND 指令 保留 线性 地 址 的 高 


10 位 ， 其 他 各 位 清 堆 ;第 372 行 ， 得 到 该 线性 地 址 在 页 目录 表 中 对 应 的 
偏 移 量 〈 目 录 项 ) 。 该 指令 等 效 于 


ahr esi,22 ;得 到 线性 地 址 高 10 位 的 值 
shl esi,2 : 乘 以 4 


无 天 的 位 已 经 清 零 ， 在 这 种 情况 下 ， 右 移 22 次 ， 再 左 移 2 次 ,干脆 
右 移 20 次 好 了 。 

我 们 说 过 ， 可 以 用 线性 地 址 来 访问 当前 页 目录 表 ， 我 们 也 知道 ， 当 
前 页 目录 表 的 线性 地 址 是 0xFFFFF000。 因 此 ， 第 373 行 ， 将 刚才 计算 出 
的 偏 移 量 和 页 目录 表 的 线性 基地 址 相 加 ， 得 到 的 结果 就 是 要 访问 的 那个 
目录 项 的 线性 地 址 。 


第 375、376 行 ， 训 试 该 目录 项 的 P 位 ， 看 它 是 个 为 "人 ”。 如 果 为 
个 ， 则 表明 对 应 的 页 表 已 经 仔 在 ， 只 要 在 那个 页 表 中 请 加 一 项 即 可 ; 个 
则 ， 必 须 先 创建 页 表 ， 并 项 与 页 目录 项 。 


注意 ， 尽 管 我 们 给 出 的 就 是 线性 地 址 ， 但 是 ， 那 不 是 处 理 器 段 部 件 
产生 的 线性 地 址 ， 第 366、367 行 ， 令 段 寄 存 右 DS 指 加 0 一 4GB 的 内 存 
段 〈 段 的 基地 址 是 0x00000000) ， 上 此后， 当 我 们 用 给 出 的 "线性 地 址 ? 作 
为 段 内 侦 移 量 访问 内 存 ， 段 部 件 才 会 输出 真正 的 线性 地 址 ， 尽 管 两 者 是 
相同 的 。 恕 之 ， 处 理 关 的 段 管 理 机 制 是 始终 存在 的 ， 没 有 任何 一 种 方法 
可 以 关闭 它 。 

如 果 对 应 的 页 目录 项 不 和 存在， 那么 ， 将 执行 第 379 一 381 行 的 指令 ， 
以 分 配 一 个 物理 页 作为 足 表 ， 并 将 页 的 物理 地 址 填写 到 页 目录 项 内 。 为 
此 ， 需 要 调用 另 一 个 过 程 allocate a 4k page 以 得 到 一 个 可 用 的 4KB 
页 


~ oO 


16.4.2 页面 位 映射 串 和 空 朵 页 的 查找 


尽管 每 个 任务 都 拥有 4GB 虚拟 内 存 空间 ， 也 可 以 自由 分 配 这 些 空 
间 ， 但 是 ， 物 理 内 存 是 有 限 的 ， 或 者 用 页 的 视角 来 说 ， 物 理 页 的 数量 是 
有 限 的 。 


写 这 本 书 的 时 候 ， 拥 有 4GB 的 物理 内 存 并 不 是 一 件 值得 小 系 的 事 
情 。 但 是 ， 所 谓 水 涨 般 高， 要 知道 ， 现 在 的 程序 也 极其 上 庞大， 而且 往往 


邵 在 内 存 中 同时 运行 看 。 为 了 分 配 足 ， 需 要 跟踪 哪些 页 已 经 分 配 ， 哪 些 
页 是 空 用 的 ， 这 对 操作 系统 来 说 是 必 做 的 事情 。 


很 容易 想到 ， 操 作 系 统 必 须 在 刚刚 获得 计算 机 控制 权 的 时 候 ， 束 检 
测 实际 的 物理 内 存 数量 ， 并 建立 一 张 表格 ， 标 明 页 的 物理 地 址 及 其 是 否 
空闲 。 当 有 程序 申请 内 存 时 ， 束 寻找 这 样 的 空 亲 页 ， 并 将 其 标记 为 已 分 
配 。 

内 存 空间 来 目 于 插 在 主板 上 的 内 存 条 ， 按 照 新 的 工业 标准 ， 每 个 内 
存 条 上 焊 有 一 个 很 小 的 只 读 存 储 器 ， 用 于 标明 该 内 存 条 的 容量 和 工作 参 
数 。 作 为 一 个 PCI(E) 设 备 ， 软 件 可 以 读 取 它 ， 以 获得 计算 机 上 的 物理 内 
存 容量 。 然 后 建立 上 述 的 页 分 配 表 。 

如 果 你 的 计算 机 上 真 的 有 4GB 物理 内 存 ， 那 么 ， 它 可 以 划分 为 
1048576 (220) 个 页 。 如 果 每 个 表 项 占 一 字 季 ， 则 需要 1MB 内 存 来 创 
建 该 表 。 显 然 ， 这 有 些 不 划算 。 为 了 简单 ， 可 以 使 用 位 串 来 指示 页 的 分 
配 情况 。 

如 图 16-21 所 示 ， 可 以 用 一 个 长 的 比特 囊 ， 叫 做 页 映射 位 串 ， 来 指示 
每 个 页 的 位 置 及 分 配 情 况 。 取 决 于 你 所 拥有 的 实际 内 存 数量 (页 数 ) ， 
该 串 最 多 可 以 有 1048576 比特 ， 由 于 每 字 节 包含 8 个 比特 ， 所 以 ， 共 需要 
131072 字 和 有 有， 也 束 是 128KB。 
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共 1048576 比 特 ， 合 128KB 
图 16-21 页 映射 位 串 示 意 儿 


比特 在 位 串 中 的 位 置 ， 决 定 了 它 所 上 映 和 册 的 页 在 哪里 。 如 图 16-21 所 
示 ， 位 0 对 应 的 是 物理 地 址 为 0x00000000 的 页 ， 位 1 对 应 的 是 物理 地 址 
为 0x00001000 的 页 ， 位 2 对 应 的 是 物理 地 址 为 0x00002000 的 页 ， 
ee ， 最 后 一 个 比特 对 应 的 是 最 后 一 个 页 ， 即 物理 地 址 为 0xFFFFF000 


除了 用 比特 所 在 的 位 置 决定 页 的 位 置 外 ， 比 特 的 值 决定 了 页 的 分 配 
情况 。 当 某 比 特 为 "0" 时 ， 表 示 它 所 对 应 的 页 未 分 配 ， 是 可 以 分 配 的 空闲 
页 ; 奋 则 ， 束 表明 那个 页 已 经 被 占用 了 ， 不 能 再 分 配给 任何 程序 。 


在 本 章 中 ， 没 有 检测 实际 可 用 内 存 的 代码 ， 仅 仅 假 定 我 们 只 有 2MB 
的 物理 内 存 可 用 。2MB 的 内 存 ， 可 分 为 512 个 页 ， 需 要 512 个 比特 的 位 
串 。 在 实际 的 程序 中 ， 没 有 声明 位 串 的 方法 ， 只 能 声明 字 节 、 字 、 双 字 
等 。 因 此 ， 只 能 用 连续 的 字 节 或 字数 据 来 形成 位 串 。 

回 到 代码 清单 16-1 中 ， 第 465 行 ， 声 明了 标号 page_bit_map， 并 人 初 
始 化 了 64 字 节 的 数据 。 这 64 字 节 首尾 相连 ， 形 成 一 个 512 比特 的 位 串 。 
对 照 图 16-21， 第 1 字 节 的 位 0 对 应 看 物理 地 址 为 0x00000000 的 页 ， 第 1 


字 节 的 位 1 对 应 着 物理 地 址 为 0x00001000 的 页 ，...... ， 第 2 字 市 的 位 0 
对 应 着 物理 地 址 为 0x00008000 的 页 ， 以 此 类 推 。 


耐心 一 点 ， 仔 细 观 察 这 个 页 映射 位 串 ， 你 会 发 现 前 32 字 节 的 值 兰 不 
多 都 是 0OxFF。 这 并 不 奇怪 ， 它 们 对 应 独 最低 问 1MB 内 存 的 那些 页 (256 
个 页 ) ， 它 们 已 经 整体 上 划 归 内 核 使 用 了 ， 设 有 被 内 核 占 用 的 部 分 多 数 
也 被 外 围 硬 件 占用 了 ， 比 如 ROM -BIOS 。 


当然 ， 如 果 你 眼 很 尖 的 话 ， 也 会 发 现 其 中 混杂 了 两 字 节 的 0x55。 这 
又 是 怎么 回 事 呢 ? 


回 到 前 面 ， 看 图 16-10， 尽 管 国 得 不 明显 ， 但 是 依然 能 看 出 ， 在 物理 
地 址 0x00030000 一 0x00040000 之 间 ， 是 一 段 较为 连续 的 空 亲 区 ， 共 
64KB， 可 划分 为 16 个 页 ， 页 的 物理 地 址 为 0x00030000 一 0x00040000， 
束 对 应 着 这 两 字 方 。 本 来 ， 这 两 字 厄 都 应 当 是 0x00， 以 表明 是 可 以 分 配 
的 空闲 页 。 不 过 ， 为 了 表明 大 的 、 连 续 的 线性 地 址 空间 不 必 对 应 着 连续 
的 页 ， 我 们 有 意 将 空闲 的 页 在 物理 上 分 开 ， 因 为 0x55 的 二 进 制 形式 是 
01010101。 同 样 的 做 法 也 出 现在 后 面 的 64 个 页 中 。 


当然 ， 这 么 做 未 必 合 法 ， 因 为 低 妆 1MB 内 存 已 经 完整 地 分 配给 了 内 
核 ， 在 内 核 的 页 表 中 ， 已 经 有 册 表 项 指 问 这 16 个 页 。 如 朱 我 们 再 把 它 分 
配给 其 他 任务 ， 那 么 ， 访 任务 的 页 表 项 也 势必 指 问 这 16 个 页 ， 等 于 重复 
分 配 。 不 过 ， 请 放心 ， 这 16 个 中 内核 是 不 会 用 到 的 ， 因 此 ， 分 配给 其 他 
任务 也 无 妨 。 


回 到 代码 清单 16-1 中 ， 来 看 过 程 allocate a 4k page 是 怎么 搜索 页 
映射 位 串 并 分 配 页 的 。 


页 观 射 位 串 位 于 内 核 数 据 段 中 。 第 332、333 行 ， 完 令 段 寄存 问 DS 
指 加 内核 数 据 段 。 


接 看 ， 第 335 一 341 行 ， 从 头 开 始 搜索 位 串 ， 奏 找 空 亲 的 页 。 有 具体 地 
说 ， 就 是 找到 第 一 个 为 “0" 的 比特 ， 并 记 下 它 在 整个 位 串 中 的 位 置 。 搜 索 
位 串 用 到 了 指令 bts。 

bts (Bit Test and Set) 指令 测试 位 串 中 的 某 比 特 ， 用 该 比特 的 值 设 
置 EFLAGS 寄存 器 的 CF 标志 ， 然 后 将 该 比特 置 “1”"。 它 最 基本 的 两 种 格 


Bes r/mL6 £16 
DES To rT32 


在 这 里 ， 目 的 操作 数 可 以 是 16/32 位 的 通用 寄存 器 ， 或 者 指 问 一 个 包 
含 了 16/32 位 实际 操作 数 的 内 存单 元 ， 用 于 指定 位 串 ， 源 操作 数 可 以 是 
16/32 位 的 通用 寄存 器 ， 用 于 指定 待 测试 的 比特 在 位 串 中 的 索引 《位 
站 

如 果 目 的 操作 数 是 通用 寄存 器 ， 那 么 ， 指 定 的 位 串 就 是 该 寄存 器 的 
内 容 (长 度 为 16 比特 或 者 32 比特 ) 。 在 这 种 情况 下 ， 根 据 操 作 数 的 长 
度 ， 处 理 器 先 求 得 源 操 作 数 除 以 16 或 者 32 的 余数 ， 并 把 它 作 为 要 测试 的 
比特 的 索引 。 然 后 ， 从 位 串 中 取出 该 比特 ， 传 送 到 EFLAGS 寄存 器 的 CF 
位 。 最 后 ， 将 该 比特 置 位 。 

则 如 果 目 的 操作 数 是 一 个 内 存 地 址 ， 那 么 ， 它 给 出 的 是 位 串 在 内 存 
中 的 起 始 地 址 ， 或 者 说 该 位 串 第 1 个 字 或 者 双 字 的 地 址 。 同 样 地 ， 源 操作 
数 用 于 指定 待 测试 的 比特 在 串 中 的 位 置 。 因 为 串 在 内 存 中 ， 所 以 其 长 度 
可 以 最 大 程度 地 延伸 ， 具 体 的 长 度 取 决 于 源 操作 数 的 尺寸 ， 毕 苋 它 用 于 
站 定 测试 的 位 置 。 如 果 源 操作 数 是 16 位 通用 寄存 器 ， 位 串 最 长 可 以 达到 
216 比特 ;如果 源 操作 数 是 32 位 的 通用 寄存 器 ， 则 位 串 最 长 可 以 达到 
232 比特 。 无 论 如 何 ， 在 这 种 情况 下 ， 指 令 执行 时 ， 处 理 需 会 用 目的 操 
作 数 和 源 操作 数 得 到 被 测 比 特 所 在 的 那个 内 存单 元 的 线性 地 址 。 人 然后 ， 
取出 该 比特 ， 传 送 到 EFLAGS 寄存 器 的 CF 人 位。 最后， 将 原 处 的 该 比特 置 
位 。 

除 此 之 外 ， 这 两 种 指令 格式 的 区 别 还 在 于 具体 操作 时 ， 处 理 喜 读 取 
的 数据 的 长 度 。 挑 选 比 特 的 工作 是 在 处 理 噩 内 部 进行 的 ， 要 先 从 内 存 中 
谈 取 含有 指定 比特 的 字 或 双 字 。 第 一 种 指令 格式 进行 的 是 16 位 的 内 存 操 
作 ， 人 处 理 右 读 的 是 一 个 字 ; 第 二 种 指令 格式 进行 的 是 32 位 的 内 存 操作 ， 
处 理 器 读 的 是 一 个 双 字 。 

bts 指令 并 不 孤独 ， 同 类 型 的 指令 还 有 btr、btc 和 bt 它们 的 区 别 如 表 
16-1 所 示 。 


表 16-1 bts/btr/btc/bt 指令 对 照 表 


英文 全 各 对 其 他 标志 位 的 时 


将 指定 位 置 的 比特 传送 到 CF 标志 位 ， 
S Blt Test and Set 加 
然后 将 其 置 位 
T 


bt 
将 指定 位 置 的 比特 传送 到 CF 标记 位 ， 本 
bt Bit Test and Reset 国生 ZF 标志 位 不 受 影 响 ， 对 OF、 
然后 将 其 复位 ( 消 零 ) a 
二 === 一 SF、AF 和 PF 标志 的 影响 未 定义 
将 指定 位 置 的 比特 传送 到 CF 标志 位 ， 
然后 将 其 取 反 


将 指定 位 置 的 比特 传送 到 CF 标志 位 


回 到 代码 清单 16-1。 


搜索 空闲 页 是 一 个 机 械 的 工作 ， 要 先 从 位 串 的 第 1 个 比特 开始 。 第 
335 行 ， 先 将 EAX 寄存 喜 清 零 ， 这 表明 我 们 要 从 位 串 的 第 1 个 比特 开始 
搜索 。 

第 337 行 ， 执 行 bts 指令 。 这 将 使 指定 的 比特 被 传送 到 标志 突 存 右 的 
CF 位 ， 同 时 那 一 位 被 置 “1”。 置 “1 是 必 做 的 工作 ， 如 果 它 原本 就 是 “1?”， 
这 也 没什么 影响 ， 如 果 它 原本 是 “0"， 那 么 ， 它 就 是 我 们 要 找 的 比特 ， 它 
对 应 的 页 将 被 分 配 ， 而 将 它 置 "1 是 应 该 的 。 

第 338 行 ， 判 断 位 串 中 指定 的 位 是 否 原本 为 "0"。 如 果 答 案 是 肯定 
的 ， 那 么 ， 太 好 了 ， 于 是 转 到 第 348 行 执行 ， 准 备 退 出 当前 过 程 ， 如果 
不 是 ， 那 么 ， 第 339 一 341 行 ， 将 EAX 的 内 容 加 一 ， 准 备 测 试 位 串 中 的 
下 一 比特 。 在 此 之 前 ， 要 先 判 断 是 否 已 经 测试 了 位 串 中 的 所 有 比特 ， 以 
防止 越界 。page_map_len 是 一 个 用 伪 指 令 equ 志明 的 常数 ， 位 于 第 473 
行 ， 它 的 值 就 是 位 串 的 字 节 数 。 将 它 习 以 8， 就 是 位 串 的 比特 数 。 在 最 坏 
的 情况 下 ， 没 有 找到 可 以 用 于 分 配 的 空闲 页 ， 则 显示 一 条 错误 消息 ， 并 
停机 。 当 然 ， 对 于 一 个 流行 的 操作 系统 来 说 ， 这 样 做 是 不 对 的 ， 正 确 的 
做 法 是 看 哪些 已 分 配 的 页 较 少 使 用 ， 然 后 将 它 换 出 到 破 盘 ， 腾 出 空间 给 
当前 需要 的 程序 ， 到 时 候 再 换 回 来 。 不 过 ， 这 已 经 超出 了 本 书 的 主题 范 
围 。 


btc Bit Test and Complement 





情况 乐观 时 ， 会 找到 一 个 可 以 分 配 的 空 几 页 ， 也 就 古 一 个 为 “0" 的 比 
特 。 第 348 行 ， 将 该 比特 在 位 串 中 的 位 置 数 值 乘 以 页 的 大 小 0x1000 (或 
者 十 进 制 数 4096) ， 束 是 该 比特 所 对 应 的 那个 页 的 物理 地 址 。 

找到 了 可 用 的 页 ， 任 务 也 融 完 成 了 了 。 第 355 行 用 于 返回 到 当前 过 程 
的 调用 者 。 可 以 看 出 ， 这 是 公共 例 程 段 内 的 内 部 过 程 ， 仅 供 同 一 段 内 的 
其 他 过 程 使 用 。 返 回 时 ， 页 的 物理 地 址 位 于 EAX 寄存 郁 中 。 


16.4.3 ”创建 页 表 并 登记 分 配 的 页 


返回 点 位 于 过 程 alloc inst a page 内 ， 本 次 调用 
a 过 程 的 目的 是 分 配 一 个 页 作为 页 表 。 页 表 的 地 址 要 
登记 在 页 目录 表 内 ， 仅 高 20 位 有 效 ， 对 应 着 页 表 物 理 地 址 的 高 20 位 ， 页 
表 地 址 的 低 12 位 是 页 表 属 性 。 从 第 380 行 可 以 看 出 ， 页 的 属性 值 是 
0x007， 即 ，US= 二 1， 特 权 级 别 为 3 的 程序 也 可 以 访问 ; RW 二 1， 页 是 可 
读 可 写 的 ; P 二 1， 页 已 经 位 于 内 存 中 ， 可 以 使 用 。 内 核 的 页 表 为 什么 允 
许 特权 级 别 为 3 的 程序 访问 呢 ? 当然 了 了 了， 原则 上 有 是 不 允许 的 ， 但 是 ， 这 个 
例 程 既 要 用 于 为 内 核 分 配 页 面 ， 也 要 用 于 为 用 户 任 务 分 配 页 面 。 对 于 前 
者 ， 要 求 将 所 分 配 页 面 的 US 位 清 *0?;， 对 于 后 者 ， 要 求 将 所 分 配 页 面 的 
U/S 位 置 “ 人 1， 这 两 者 难以 兼顾 。 为 了 不 把 事情 搞 复 杂 而 又 能 说 明 问题 ， 
用 当前 过 程 所 分 配 的 页 面 ，US 位 一 概 设置 成 "人 。 
刚 分 配 的 页 是 作为 页 表 使 用 的 ， 它 应 当 登 记 在 页 目录 表 内 ， 作 为 目 
录 项 存在 。 现 在 ，ESI 寄存 需 中 的 内 容 驶 是 该 目录 项 的 线性 地 址 。 第 381 
行 ， 将 目录 项 的 内 容 修改 为 页 表 的 物理 地 址 。 


过 程 alloc inst a_page 的 功能 是 根据 给 定 的 线性 地 址 ， 设 置 页 目录 
表 和 页 表 的 内 容 。 因 此 ， 只 有 妆 页 表 不 存在 的 时 候 ， 才 动态 分 配 一 个 页 
表 。 无 论 如 何 ， 现 在 页 表 已 经 有 了 ， 镜 下 的 工作 束 契 为 那个 线性 地 址 分 
配 一 个 最 终 的 页 ， 并 登记 在 页 表 内 。 为 此 ， 需 要 访问 页 表 。 这 同样 是 一 
个 两 难 的 问题 ， 在 分 页 机 制 下 ， 访 问 内 存 需 要 通过 页 目录 表 和 页 表 ， 而 
我 们 访问 的 正 是 页 表 。 


这 可 如 何 是 好 ? 


不 过 页 未 二 原来 束 有 ， 还 旦 刚才 创建 的 ， 程 序 的 执行 沉 程 最 终 会 到 
达 第 385 行 。 因 为 用 于 分 配 页 的 线性 地 址 位 于 EBX 寄存 禹 中 ， 这 一 行 用 


于 在 ESI 寄存 硕 中 制作 它 的 一 个 副本 。 


因为 是 要 修改 页 表 闪 的 页 表 项 ， 所 以 ， 无 论 如 何 ， 必 须要 知道 充 
表 项 的 线性 地 址 才 行 ， 这 可 以 分 几 步 来 完成 : 


首先 ， 我 们 知道 ，ESI 寄存 器 中 的 线性 地 址 ， 其 高 10 位 决定 了 页 表 
在 页 目录 表 中 的 登记 位 置 ， 中 间 10 位 ， 决 定 了 页 在 页 表 中 的 登记 位 置 。 
很 显然 ， 要 访问 页 表 ， 就 得 把 页 表 当 成 普通 页 来 访问 。 如 此 一 来 ， 那 个 
页 表 项 在 页 表 中 的 位 置 ， 就 相当 于 数据 在 页 中 的 位 置 。 为 此 ， 应 当 把 ESI 


寄存 器 的 中 间 10 位 乘 以 4 之 后 ， 挪 到 该 寄存 器 的 低 12 位 ， 作 为 页 内 偏 移 


三 | 


一 一 一 人 


里 ; 


其 次 ， 既 然 把 页 表 作 为 普通 的 页 来 对 行 ， 那 么 ， 页 部 件 势 必要 先 访 
问 该 “页 "的 “页 表 ”。 页 表 的 物理 地 址 是 登记 在 页 目录 表 中 的 ， 它 在 页 目录 
表 中 的 位 置 由 ESI 寄存 右 的 高 10 位 指定 ， 因 此 ， 残 得 把 页 目录 表 当 成 该 
“页 "的 “页 表 " 来 用 ， 并 把 ESI 寄存 奏 的 局 10 位 挪 到 中 间 10 位 上 ， 作 为 页 
表 项 的 过 引号。 


最 后 ， 为 了 将 页 目录 表 作 为 页 表 来 用 ， 归 将 ESI 琳 存 上 莫 的 品 10 位置 
成 0x3FF。 这 童 味 看 ， 页 目录 表 内 最 后 一 个 目录 项 束 是 外 表 的 物理 地 址 。 
驻 因 为 该 目录 项 义 指 癌 页 目录 表 目 身 ， 履 ， 等 于 是 义 把 页 目录 表 当 成 页 
表 来 用 。 人 至 此 ， 任 务 完成 ，ESI 寄存 名 中 得 到 的 攻 值 ， 束 古 要 修改 的 那 
个 页 表 项 的 线性 地 址 。 下 和 面 结合 代码 消 半 来 讲 一 讲 具体 的 做 法 。 


第 386 一 388 行 ， 将 ESI 寄存 器 中 的 内 容 右 移 10 次 ， 清 除 两 边 ， 只 
保留 中 间 的 10 人 位， 同时， 将 高 10 位 的 内 容 改 成 二 进 制 的 
1111111111 〈0x3FF) 。 这 样 一 来 ， 当 页 部 件 进行 地 址 转换 时 ， 它 用 高 10 
位 的 0x3FF 乘 以 4 去 访问 页 目录 表 。 由 于 此 表 项 存放 的 是 页 目录 表 自 己 
的 物理 地 址 ， 因 此 ， 此 表 项 所 指 同 的 页 表 ， 正 是 当前 页 目录 表 目 己 ， 这 
实际 上 是 把 页 目录 表 当 成 页 表 来 用 。 


接着 ， 页 部 件 又 用 中 间 的 10 位 去 访问 页 表 ， 其 实 就 是 访问 页 目录 表 
自己 。 于 是 ， 它 就 得 到 了 页 的 物理 地 址 ， 其 实 就 是 页 表 的 物理 地 址 。 很 
好 ， 现 在 只 需要 低 12 位 的 偏 移 量 束 可 以 了 。 因 为 是 把 页 表 当 成 普通 的 页 
来 访问 ， 因 此 ， 需 要 把 原 线 性 地 址 的 中 间 10 位 当成 页 内 偏 移 量 来 用 。 

这 束 是 说 ， 现 在 ESI| 寄存 器 中 的 内 容 ， 束 是 页 表 的 线性 地 址 。 

调用 者 传 入 的 线性 地 址 依然 完好 地 保存 在 EBX 寄存 器 中 ， 到 了 过 程 
的 最 后 ， 也 不 必 制 造 它 的 副本 了 ， 直 接 用 吧 。 第 391 行 ， 用 and 指令 只 
保留 中 间 的 10 位 ， 两 边 清 零 ， 第 392 行 ， 将 它 右 移 12 次 ， 再 乘 以 4〈 左 
移 2 次 ) ， 作 为 表 内 偏 移 量 。 因 为 无 天 位 都 已 清 零 ， 故 可 以 下 接 写 成 


shr ebx,10 


页 表 的 线性 地 址 位 于 ESI 寄存 器 中 ， 现 在 ， 第 393 行 ， 将 它 和 EBX 
寄存 器 中 的 偏 移 量 相 加 (合并) ， 就 是 要 修改 的 那个 页 表 项 的 线性 地 
址 。 


要 修改 的 位 置 找 到 了 ， 但 页 还 没有 分 配 昵 。 第 394 行 ， 调 用 过 程 
allocate _a_4k_page 分 配 一 个 页 ， 并 在 EAX 寄存 天 中 返回 页 的 物理 地 
址 。 第 395 行 ， 为 其 添加 属性 值 0x007。 第 396 行 ， 将 页 表 项 的 内 容 修改 
为 页 的 物理 地 址 。 


人 至此， 给 出 一 个 起 始 的 线性 地 址 ， 分 配 一 个 页 ， 并 登记 在 层次 化 的 
分 页 结构 中 ， 任 务 完 成 。 第 403 行 ，retf 指令 将 控制 返回 到 调用 者 。 


16.4.4 创建 内 核 任 务 的 TSS 


从 过 程 allocate a_4k_page 返回 后 ， 人 返回 点 位 于 代码 清 蛙 16-1 的 第 
1028 行 。 


在 为 系统 内 核 的 任务 状态 段 (TSS) 分 配 了 虚拟 地 址 空间 和 页 之 
后 ， 这 一 行将 标号 core next laddr 处 的 数据 修改 为 下 一 个 可 分 配 的 起 始 
线性 地 址 。 下 一 次 在 内 核 的 虚拟 地 址 空间 里 分 配 内 存 时 ， 将 使 用 这 个 新 
值 作为 起 始 的 线性 地 址 。 


第 1031 一 1038 行 ， 填 写 和 初始 化 TSS 中 的 静态 部 分 ， 有 些 内 容 ， 
比如 CR3 寄存 器 域 ， 对 任务 的 执行 来 说 很 关键， 必须 事先 予以 填写 。 


一 旦 分 配 了 物理 页 ， 并 填写 了 页 目录 项 和 页 表 项 ， 就 立即 可 以 用 那 
个 线性 地 址 来 访问 内 存 。 此 时 ， 整 个 过 程 是 相反 的 ， 页 部 件 用 那个 线性 
地 址 访问 页 目录 表 和 页 表 ， 生 成 物理 地 址 。 还 有 ， 尽 管 你 在 指令 中 给 出 
的 确实 是 线性 地 址 ， 但 并 非 是 由 上 段 部 件 生成 的 线性 地 址 。 在 Intel 处 理 医 
上 ， 段 机 制 是 无 法 关闭 的 ， 因 此 ， 你 必须 使 用 0 一 4GB 的 段 ， 加 上 你 的 
“线性 地 址 ”， 才 得 使 段 部 件 生成 真正 的 线性 地 址 ， 尺 管 两 个 线性 地 址 在 数 
值 上 没有 任何 不 同 。 

因此 ， 要 访问 TSS， 必 须 通 过 段 琳 存 右 ES 所 指 问 的 0 一 4GB 数据 
段 。 

第 1041 一 1046 行 ， 创 建 内 核 任 务 的 TSS 描述 行 ， 并 安装 到 GDT 
中 。TSS 描述 符 选 择 子 保存 在 内 核 数据 段 中 ， 位 于 第 530 行 ， 在 那里 ， 
声明 了 标号 program_man_tss 并 初始 化 了 1 个 字 。 在 任务 切换 时 ， 需 要 
使 用 它 。 

由 于 当前 任务 事实 上 正 处 于 运行 中 ， 因 此 ， 只 要 后 补 手续 即 可 使 其 
完全 合法 。 第 1050 行 ， 将 当前 任务 的 TSS 摘 述 符 传 送 到 任务 寄存 需 


TR。 


16.5 用户 任务 的 创建 和 切换 


16.5.1 多 段 模型 和 段 页 式 内 存 党 理 


一 二 以 来 ， 我 们 部 工作 在 分 段 的 内 存 官 理 模型 上 。 如 图 16-22 所 示 ， 
在 保护 模式 下 ， 肯 和 完 按 程 序 的 结构 分 段 ， 创 建 各 个 段 的 接 述 从， 用 摘 述 
从 指 问 物 理 内 存 中 的 各 个 段 。 插 述 从 中 的 基地 址 给 出 了 上 段 的 起 始 物 理 地 
址 ， 界 限 值 给 出 了 段 的 长 度 〈 边 界 ) ， 属 性 值 指示 了 段 的 类 型 和 特权 级 
列 等 性 质 。 


Re 
A/ 物理 内 存 
' FFFFFFFF 


SECTION seg cs -7-77 





00000000 
图 16-22 传统 的 多 段 模型 示意 图 (未 开启 页 功能 
传统 的 多 段 模型 (Multi-Segment Model) 适用 于 开启 了 页 功能 之 后 
的 系统 环境 。 如 图 16-23 所 示 ， 首 先 依 然 是 按 程 序 的 结构 分 段 ， 创 建 各 个 
段 的 描述 符 。 但 是 ， 段 是 在 任务 目 己 的 虚拟 地 址 空间 内 分 配 的 ， 而 不 是 
在 物理 内 存 中 分 配 的 。 因 此 ， 段 描述 符 中 的 基地 址 是 段 的 线性 地 址 ， 或 
者 说 是 虚拟 地 址 。 


因为 开局 了 页 功能 ， 虚 拟 地 址 空间 上 的 段 要 映射 到 物理 内 人 存 中 的 一 
个 或 多 个 页 。 段 是 连续 的 ， 但 它 所 占用 的 页 不 要 求 是 相 邻 的 。 在 未 开局 
页 功能 之 前 ， 段 基地 址 和 段 偶 移 相 加 产生 的 线性 地 址 束 是 物理 地 址 ， 开 
司 页 功能 之 后 ， 线 性 地 址 还 要 经 页 部 件 转换 后 ， 才 能 得 到 实际 的 物理 地 
le 


虚拟 内 存 空间 物理 内 存 


[RE 9 | 
-了 [RE | 、 上 
[RE | 、 ss 
lL . b 人 mi 
、 
、 





六 ”4kB 页 
00000000 


00000000 


图 16-23 ”分 页 机 制 下 的 多 段 模型 示意 图 

为 什么 要 分 段 ? 这 是 个 问题 。 

分 段 的 做 法 是 随 着 8086 处 理 器 的 流行 和 广泛 应 用 而 兴起 的 。 那 个 时 
候 ， 处 理 器 是 16 位 的 ， 只 能 处 理 16 位 的 地 址 数据 ， 因 此 ， 可 访问 的 内 存 
空间 是 64KB。 为 了 访问 1MB 的 内 存 ， 只 能 分 段 。 如 此 一 来 ， 可 以 将 控制 
从 一 个 段 转移 到 男 一 个 段 ， 也 可 以 通过 将 新 段 的 基地 址 加 载 到 数据 段 寄 
和 存 右 (DS 和 ES) ， 来 访问 另 一 个 段 中 的 数据 。 和 总 之 ， 通 过 这 种 浴 拙 
的 、 变 通 的 、 迁 回 的 方法 ， 束 能 间接 地 获得 访问 1MB 内 存 的 能 


在 8086 处 理 桌 上 增加 分 段 机 制 还 有 一 个 额外 的 好 处 ， 那 就 是 可 以 用 
很 简单 的 方法 实现 程序 的 重 定 位 ， 让 程序 在 内 存 中 的 位 置 自 由 浮动 ， 而 
叉 不 影响 它 的 访问 和 执行 。 但 是 ， 这 只 是 一 个 附加 的 礼物 ， 因 为 即使 不 
分 段 ， 也 有 办 法 实现 程序 的 目 由 译 动 和 重 定 位 ， 只 是 肯定 会 麻烦 很 多 。 


任何 事情 只 要 一 流行 ， 束 会 被 认为 是 必然 的 ， 而 不 礼 它 事实 上 有 多 
个 合理。 到 了 32 位 处 理 融 时 代 ， 分 段 的 方法 依然 被 完整 地 剑 留 下 来 了 。 
也 许 是 真 的 动 了 脑筋 、 花 了 心思 ， 处 理 需 的 设计 者 居然 找到 了 分 段 模型 
的 好 处 ， 那 吏 是 可 以 防止 一 个 程序 访问 不 属于 目 己 的 段 。 


但 是 ， 由 于 分 页 功能 的 出 现 ， 蚤 化 了 人 人们 关于 分 段 机 制定 合 合 理 的 
信心 。 内 存 的 访问 是 通过 页 目录 表 和 页 表 进 行 的 ， 每 个 任务 都 有 目 己 的 
页 目录 表 和 页 表 ， 操 作 系 统 控 制 看 物理 页 的 分 配 权 ， 除 非 它 把 一 个 页 分 
配给 茶 个 任务 ， 并 填 与 到 那个 任务 的 页 目录 表 和 页 表 里 ， 人 否则 ， 那 个 任 
务 不 可 能 拥有 访问 那个 内 存 位 置 的 能 


尽管 处 理 器 的 设计 者 一 直 在 宣称 ， 把 分 段 和 分 页 机 制 结合 在 一 起 ， 
将 获得 最 大 强度 的 保护 功能 ， 但 是 ， 事 实 上 ， 在 现实 的 软件 设计 者 那 
里 ， 多 段 模型 已 经 不 那么 吃香 了 。 


典型 地 ，32 位 的 处 理 强 拥有 32 根 地 址 线 和 32/64 根 数据 线 ， 这 使 得 
它 不 用 将 4GB 或 多 于 4GB 的 内 存 空间 划分 成 多 个 段 ， 丈 能 完全 控制 它 。 
如 此 一 来 ， 软 件 人 设计 痢 束 会 倾 同 于 不 分 段 。 当 然 ， 程 序 的 浪 动 和 午 定 位 
将 不 可 能 冉 依 赖 于 分 段 机 制 ， 但 并 不 是 没有 其 他 办 法 。 


16.5.2 平坦 模型 和 用 户 程 序 的 结构 


不 分 段 的 内 存 管理 模型 称 为 平坦 模型 (Flat Model) 。 尽 管 说 是 不 分 
段 ， 但 你 干 万 不 要 信以为真 ， 分 段 是 Intel 处 理 器 的 固有 机 制 ， 处 理 器 总 
是 按 “ 段 地 址 十 偏 移 量 " 来 形成 线性 地 址 ， 不 可 能 线 开 这 种 工作 机 制 。 


因此 ， 如 图 16-24 所 示 ， 所 谓 的 平坦 模型 ， 就 是 将 全 部 4GB 内 存 整 
体 上 作为 一 个 大 上段 来 处 理 ， 而 不 是 分 成 小 的 区 块 。 在 这 种 模型 下 ， 所 有 
段 都 是 4GB ， 每 个 段 的 摘 述 符 都 指 癌 4GB 的 段 ， 段 的 基地 址 都 是 
0x00000000， 段 界限 都 是 0xFFFFF， 粒 上 度 为 4KB。 


在 这 种 基本 的 平坦 模式 下 ， 程 序 在 编写 的 时 候 不 分 段 ， 即 ， 只 你 留 
一 个 段 ， 代 人 码 和 数据 痢 在 这 个 段 内 ， 相 互 邻 接 ， 但 一 般 并 不 交叉 。 很 显 
和 然 ， 在 这 种 模式 下 ， 不 能 孚 党 到 段 傈 护 机 制 的 好 处 ， 段 界限 和 数据 访问 
的 检查 仍然 进行 ， 但 从 不 会 产生 违例 的 情况 。 原 因 很 和 商 单 ， 每 个 段 持 述 
符 的 基地 址 都 是 0， 实 际 使 用 的 段 界 限 都 是 0xFFFFFFFF， 残 任务 内 的 地 
址 至 间 而 言 ， 对 任何 内 存 位 症 的 访问 都 是 合法 的 。 


一 个 使 用 基本 平坦 模式 的 实例 是 代码 清单 16-2， 程 序 没 有 分 段 ， 或 
者 说 只 有 一 个 大 的 段 。 在 程序 中 ， 指 令 和 数据 的 俩 移 量 只 和 它们 出 现 的 
目 然 位 置 有 大 。 


在 这 里 ， 一 个 基本 的 特 扣 是 ， 所 有 内 容 部 十 按 类 型 组 织 的 。 比 如 ， 
一 开始 是 和 整个 程序 有 关 的 统计 数据 ， 比 如 程序 的 大 小 、 入 口 点 、U- 
SALT 的 大 小 和 起 始 位 置 等 ， 在 往 利 ， 这 了 束 是 用 户 程序 头 部 段 ， 然后 ， 宇 
程序 中 用 到 的 数据 ， 包 括 U-SALT。 传 统 上 ， 这 了 束 是 数据 段 ， 最 后 ， 古 可 
执行 代码 部 分 。 
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到 局 性 | 界限 | 
图 16-24 基本 的 平坦 模型 示意 图 


传统 上 ， 这 儿 个 部 分 是 以 段 为 目 然 分 界 的 。 和 但 是 现在 ;它们 混合 在 
一 起 ， 按 类 型 划分 ， 而 不 是 段 ， 类 似 于 几 种 流行 的 可 执行 文件 中 的 节 。 

程序 本 身 不 大 ， 但 编译 之 后 却 很 大 。 这 是 因为 ， 第 23 行 ， 保 留 了 一 
个 很 大 的 空 日 区 域 。 在 那里 ， 声 明了 标号 reserved， 并 初始 化 了 128000 
字 节 。 衬 白 区 的 位 置 选择 也 很 特别 ， 位 于 U-SALT 的 中 间 ， 把 U-SALT 表 
分 为 还 带 相 望 的 两 部 分 ， 束 像 牛 妓 和 织女 。 这 是 有 意 的 ， 不 管 是 写 程 
序 ， 还 是 处 理 器 执行 程序 ， 内 存 的 访问 都 应 该 是 线性 的 、 连 续 的 、 连 贯 
的 ， 为 程序 分 配 内 存 时 ， 每 个 页 在 物理 上 本 就 不 相 邻 ， 现 在 ，U-SALT 这 
么 庞大 ， 必 定 会 被 分 散 于 各 处 。 这 么 做 ， 只 是 为 了 验证 处 理 器 和 当前 程 
序 是 否 能 在 分 页 机 制 下 正常 工作 。 


需要 注意 的 是 ，U-SALT 的 大 小 是 256 字 节 对 齐 的 ， 因 为 每 个 表 项 占 
256 字 节 。 因 此 ， 空 白 数 据 的 大 小 也 应 当 是 256 的 整 倍数 。 否 则 ， 在 程 


序 的 重 定位 阶段 ， 内 核 将 不 能 正确 地 处 理 USALT 表 。 


16.5.3 用户 任务 的 虚拟 地 址 空间 分 配 


现在 ， 回 到 代 但 清单 16-1， 开 始 加 载 用 户 程序 并 创建 相应 的 任务 。 


首先 要 创建 任务 控制 块 CTCB ) 。 这 本 来 不 是 个 问题 ， 但 由 于 现在 
每 个 任务 都 拥有 了 自己 独立 的 4GB 虚拟 地 址 空间 ， 问 题 就 来 了 。 


一 般 来 说 ， 所 有 任务 的 TCB 都 应 当 占 用 内 核 的 地 址 空间 ， 在 内 核 的 
虚拟 地 址 空间 里 分 配 。 任 务 都 是 由 内 核 负 贡 管 理 和 调度 的 ， 如 果 TCB 位 
于 任务 上 自己 的 地 址 空间 里 ， 而 不 是 内 核 的 地 址 空间 里 ， 那 么 ， 这 同时 也 
意味 着 ， 在 内 核 的 页 目录 表 和 页 表 中 ， 没 有 指 同 TCB 所 在 页 的 表 项 ， 内 
核 不 可 能 访问 到 它 。 

第 1055 一 1057 行 ， 用 于 在 内 核 的 虚拟 地 址 空间 里 分 配 4KB 的 内 存 
(页 ) ， 这 和 上 一 次 在 内 核 中 分 配 内 存 的 做 法 是 一 样 的 。 

第 1059 一 1062 行 ， 初 始 化 TCB， 为 菜 些 域 赋 初 值 。 任 务 控制 块 

《TCB) 9E ale 25 所 示 ， 和 上 一 章 相 比 ， 己 经 大 大 简化 了 ， 只 保 
留 了 少数 项 目 。 意味 着 ， 和 以 往 相 比 ， 用 户 程 序 的 加 载 过 程 会 简 


得 多 


TS 
ga 


TSS 的 线性 地 址 
十 0x14 一 二 


LDT 的 线性 地 址 


Tel 一: 


0 — 
-0x0 —» 
二 0%00 一 到 


图 16-25 任务 控制 块 (TCB) 的 结构 





在 TCB 中 ， 有 两 个 项 目 应 该 在 创建 用 户 任 务 前 束 予 以 填写 和 初始 
化 ， 它 们 是 LDT 当前 界限 值 和 下 一 个 可 用 的 线性 地 址 。LDT 当前 界限 值 
应 该 被 初始 化 为 0xFFFF， 这 是 计算 机 局 动 时 ，LDTR 寄存 右 中 的 默认 界 
限 值 ，LDTR 中 的 界限 部 分 只 有 16 位 。LDT 的 界限 是 LDT 的 长 度 减 一 ， 
LDT 的 初始 长 度 为 0， 因 此 ， 其 界限 值 是 0OxFFFF。 


每 个 任务 都 有 目 己 的 4GB 虚拟 内 存 空 间 ， 线 性 地 址 范围 是 
0x00000000 一 0xFFFFFFFF， 它 是 任务 目 己 的 空间 ， 可 以 任意 分 配 和 使 
用 。 当 然 ， 实 际 可 以 使 用 的 空间 是 前 2GB， 后 2GB 被 任务 的 全 局 部 分 占 
用 ， 映射 并 指 同 内 核 的 页 表 。 一 般 来 说 ， 第 一 个 可 以 分 配 的 线性 地 址 是 
0x00000000， 要 把 这 个 数值 填写 到 TCB 的 “下 一 个 可 用 线性 地 址 " 域 中 。 


在 填写 了 以 上 两 个 TCB 域 后 ， 第 1062 行 ， 将 此 TCB 挂 到 TCB 链 
上 。 该 链 的 作用 将 在 第 17 间 中 进行 抢占 式 任务 切换 时 才能 体现 出 来 。 

第 1064 一 1067 行 ， 在 当前 栈 中 压 入 两 个 参数 ， 分 别 是 用 户 程 序 的 
TCB 基地 址 和 起 始 人 逻辑 刷 区 号 ， 然 后 调用 过 程 load_relocate_program 加 
载 和 重 定 位 用 户 程 序 ， 并 创建 为 一 个 任务 。 


16.5.4 ”用户 程序 的 加 载 


要 加 载 用 户 程 序 ， 并 将 其 创建 为 一 个 任务 ， 衣 和 完 要 做 的 事 束 是 分 配 
内 存 空间 。 


在 分 页 机 制 下 ， 每 个 任务 都 有 目 己 的 4GB 虚拟 地 址 空间 ， 内 存 分 配 
是 在 任务 自己 的 地 址 空间 上 进行 的 。 当 然 ， 内 核 可 以 做 这 些 事 ， 它 为 用 
户 任 务 创 建 页 目录 表 和 页 表 ， 然 后 看 看 用 户 程 序 有 多 大 ， 需 要 多 少 内 人 存 
空间 ， 根 据 需 要 分 配备 干 物理 页 ， 并 将 它们 登记 在 页 目录 表 和 页 表 中 ， 
以 便 能 够 访问 它们 。 最 后 ， 将 用 尸 程序 的 内 容 从 便 盘 读 出 后 号 进 这 些 页 
中 。 


可 是 ， 我 们 起 了 一 件 事 。 


在 上 和 耐 ， 内 核 可 以 为 用 己任 务 创建 员 目 录 表 和 页 表 ， 也 能 够 根据 用 
己 程 序 的 大 小 分 配 物 理 页 ， 并 修改 页 目录 表 和 页 表 ， 这 部 没 问 题 。 但 
是 ， 它 修改 的 应 当 是 用 户 任 务 的 足 目 录 表 和 页 表 ， 而 不 是 它 目 己 的。 要 
知道 ， 现 在 是 在 内 核 中 执行 ， 处 理 带 使 用 的 是 内 核 的 页 目录 表 和 页 表 ， 
这 是 由 控制 寄存 器 CR3 所 决定 的 。 在 内 存 的 访问 上 上， 处理 器 是 公平 的 ， 





因为 即使 是 操作 系统 ， 也 不 能 访问 未 在 当前 外 目录 表 和 页 表 中 登记 的 内 
和 存 空间 。 


好 吧 ， 那 我 们 可 以 让 和 内核 先 创 建 用 户 任务 的 页 目录 表 ， 然 后 ， 临 时 
改变 控制 寄存 卉 CR3 的 内 容 ， 便 其 指 问 这 个 新 的 页 目录 表 ， 并 在 这 个 新 
表 上 做 那 芋 事情 。 等 用 户 程序 加 载 完 年 ， 新 任务 也 创建 成 功 ， 再 切换 到 
内 核 目 己 的 页 目录 表 。 


然而 这 也 会 出 问题 。 内 核 也 要 徘 目 己 的 页 目 录 表 和 页 表 才 能 正 剃 工 
作 ， 一旦 改变 了 页 目录 表 ， 狐 页 目 录 表 还 是 空 的 ， 当 内 核 访 问 目 己 的 地 
址 空间 时 ， 处 理 磺 的 页 部 件 突 然 肥 现 目 己见 六 的 页 目录 项 全 不 见 了 。 于 
是 ， 叉 一 个 处 理 套 异 利 不 可 和 避免 地 及 生 了 。 


一 个 可 行 的 方案 是 ， 创 建 用 己任 务 的 页 目 录 表 ， 并 将 内 核 员 目录 表 
中 的 内 容 复 制 过 去 。 然 后 ， 切 换 a 到 用 己任 务 的 页 目录 表 上 去 工作 。 这 样 
做 是 合理 的 ， 我 们 一 直 在 说 ， 每 个 任务 部 拥有 4GB 的 虚拟 内 和 存 空间 ， 但 
前 2GB 是 它 私有 有 的， 后 2GB 是 全 局 部 分 ， 英 射 到 内 核 的 地 址 空间 。 也 只 
有 这 样 ， 才 能 使 内 核能 够 继续 正 第 运行 ， 同 时 还 能 在 页 目录 表 的 前 半 部 
分 创建 任务 目 己 私 有 的 分 页 系统 。 

上 面 的 方法 已 经 足够 好 了 ， 如 条 还 要 说 些 什么 的 话 ， 那 就 是 ， 还 有 
更 好 的 办 法 。 即 ， 依 然 在 内 核 的 地 址 空间 上 工作 ， 或 者 说 ， 依 然 使 用 内 
核 目 己 的 外 目录 表 ， 但 只 修改 它 的 醒 半 部 分 ， 因 为 那里 属于 任务 的 局 部 
地 址 空间 。 最 后 ， 骨 把 内 核 的 页 目录 表 复 制 一 份 ， 作 为 用 尸 任务 的 页 目 
录 表 。 

要 做 什么 ， 现 在 已 经 清楚 了 。 现 在 ， 回 到 代码 清单 16-1， 来 看 看 具 
体 的 实施 步 又 。 


第 585 一 590 行 和 上 一 革 相 同 ， 做 一 些 寄存 此 内 容 的 保护 工作 ， 并 为 
访问 栈 中 的 参数 做 准备 。 


第 592 一 602 行 ， 用 于 将 当前 页 目录 表 的 前 半 部 分 清空 。 在 每 次 创建 
一 个 新 任务 时 ， 都 应 当 清 空 内 核 页 目录 表 的 前 512 个 目录 项 。 当 前 页 目 
录 表 的 后 半 部 分 是 由 内 核 使 用 的 ， 内 核 的 虚拟 地 址 空间 被 映射 在 每 个 任 
务 的 高 地 址 端 ， 即 0x80000000 之 后 。 我 们 已 经 知道 ， 当 前 页 目录 表 的 线 
性 地 址 是 0xFFFFF000， 这 是 它 的 起 始 地 址 ， 位 于 EBX 寄存 器 中 。ESI 
琳 存 右 用 于 提供 每 个 表 项 的 索引 号 ， 将 索引 号 乘 以 4， 再 和 其 地址 相 加 ， 
就 能 得 到 每 个 目录 项 的 线性 地 址 ， 一 共 要 处 理 512 个 表 项 。 


接 下 来 要 计算 用 户 程 序 的 大 小 ， 为 完全 加 载 它 做 准备 。 


第 605、606 行 ， 使 段 寄 人 存 苍 DS 指 癌 内 核 数据 段 ， 准 备 从 人 硬盘 上 把 
用 户 程序 的 第 一 个 而 区 读 入 内 核 缓 冲 区 。 


第 608 一 610 行 ， 从 栈 中 取得 用 户 程 序 所 在 的 地 辑 局 区 写 ， 和 内 核 绥 
冲 区 的 痛 地 址 一 起 ， 作 为 参数 调用 过 程 read_hard_disk_0， 读 取 用 户 程 
厅 有 的 第 一 个 局 区 。 


用 户 程 序 的 第 一 个 双 字 惑 是 它 的 大 小 ， 这 征 约 定好 的 ， 改 ， 第 613 
行 ， 直 接 将 内 核 缓冲 区 的 第 一 个 双 字 传送 到 EAX 寄存 价 。 


和 以 往 不 同 ， 现 在 的 内 存 分 配 是 按 页 进行 的 ， 所 以 最 好 使 程序 的 大 
小 能 被 4096 整除 。 第 615 行 ， 强 制 使 程序 的 大 小 为 4096 的 整 倍 数 ， 如 
果 一 个 数 能 被 4096 整除 ， 那 么 它 的 最 低 12 位 必然 全 是 零 。 如 此 处 理 之 
后 ， 新 数值 可 能 比 原 数值 小 。 因 此 ， 第 616 行 ， 为 它 增 加 4096 字 节 ， 多 
总 比 少 好 。 


第 617、618 行 ， 看 一 下 处 理 之 前 的 程序 大 小 ， 如 果 人 家 本 来 束 是 
4096 的 整 倍数 〈 低 12 位 全 是 零 ) ， 那 就 不 用 新 值 ， 还 用 旧 值 ， 如 果 原 
先 的 低 12 位 不 全 是 零 ， 说 明 我 们 处 理 得 对 ， 应 该 用 新 值 。 


第 620、621 行 ， 将 程序 的 大 小 右 移 12 次 ， 相 当 于 除 以 4096， 这 得 
到 的 是 它 占 用 的 页 数 。 为 什么 要 先 传 送 到 ECX 寄存 需 昵 ? 原因 是 ， 下 面 
要 用 ECX 寄存 器 的 内 容 来 控制 循环 次 数 。 


循环 的 目的 是 分 配 物 理 页 ， 并 以 4KB 为 单位 读 取 用 户 程序 来 填充 
页 。 这 里 不 是 一 个 循环 ， 而 征 两 个 ， 而 且 是 众 套 的 ， 即 外 循环 和 内 循 
环 。 外 循环 负责 分 配 4KB 页 ， 和 框架 如 下 : 


2 
mov ebx, [es:esi+0x06] ;取得 可 用 的 线性 地 址 
add dword [es:esi+0x06],0x1000 
call sys routine seg sel:alloc inst a page 


push ecx 
;这 里 是 内 循环 的 代 公 


pop ecx 


Le slice 


在 循环 开始 之 前 ， 已 经 在 第 627 行 把 ESI 寄存 器 的 内 容 置 为 用 户 程 序 
TCB 的 基地 址 。 所 以 ， 外 循环 先 访 问 用 户 任 务 的 TCB， 在 它 的 虚拟 内 存 
空间 上 分 配 4KB 内 存 ， 并 返回 该 段 内 存 的 线性 地 址 。 接 看 ， 用 该 线性 地 
址 分 配 一 个 4KB 的 页 。 


以 上 就 是 外 循环 的 功能 ， 很 简单 。 内 循环 租 套 在 外 循环 中 ， 也 要 用 
到 ECX 寄存 器 ， 所 以 ， 在 开始 内 循环 之 前 ， 先 将 ECX 的 内 容 压 栈 保存 ， 
内 循环 结束 之 后 ， 立 即将 它 出 栈 恢 复 ， 并 开始 下 一 次 外 循环 。 

内 循环 的 代码 如 下 : 


mov ec 全 2 

A 
call Svs routine Seo sel read hard disk 0 
ine ax 


1o0p D3 


外 循环 每 执行 一 次 ， 内 循环 要 完整 地 执行 8 次 。 故 ， 一 开始 残 将 
ECX 寄存 需 的 内 容 设 为 8。 然 后 ， 反 复 调 用 过 程 read_hard _ disk_0 从 硬 
盘 上 旋 取 用 户 程 序 。EAX 寄存 器 的 内 容 是 在 第 626 行 设 置 的 ， 是 用 户 程 
序 的 起 始 逻 辑 硬 区 号 ， 每 读 一 个 忆 区 后 ，inc 指令 将 其 加 一 ， 指 同 下 一 个 
要 读 取 的 逻辑 而 区 。 

过 程 read_hard disk_0 需要 两 个 参数 ， 除 了 EAX 寄存 需 中 的 尿 辑 届 
区 亏 外 ， 段 寄存 器 DS 必须 指 问 缓冲 区 所 在 的 段 ，EBX 寄存 器 必须 指 回 
缓冲 区 的 线性 地 址 。EBX 寄存 器 中 的 线性 地 址 在 外 循环 中 依靠 内 存 分 配 
得 到 ， 而 段 寄 存 器 DS 是 在 第 623、624 行 设 置 的 ， 在 那里 ， 令 它 指 向 0 一 
4GB 的 数据 段 。 这 就 是 为 什么 在 ES 已 经 指向 0~4GB 数据 段 的 情况 下 ， 
不 用 ES， 而 非得 用 DS 的 原因 。 


这 段 代 人 码 虽 然 简 单 ， 但 有 很 多 可 说 的 地 方 。 首 先 ， 分 页 机 制 下 ， 内 
存 是 先 登 记 ， 后 使 用 的 。 内 存在 用 户 任 务 目 己 的 虚拟 地 址 空间 上 分 配 ， 
过 程 alloc inst a_page 分 配 一 个 空闲 的 页 ， 并 登记 到 当前 页 目录 表 和 页 
表 中 。 只 有 这 样 做 了 之 后 ， 才 能 访问 这 段 内 存 ， 才 能 把 用 户 程序 写 进 

其 次 ， 程 序 在 编写 和 编译 之 后 ， 都 是 连续 的 ， 在 加 载 后 不 能 保证 这 
一 点 。 页 是 随机 分 配 的 ， 在 一 个 真实 的 系统 中 ， 两 个 页 相 邻 的 几率 很 
小 。 但 是 ， 这 不 会 影响 到 程序 的 正确 执行 。 尽 管 页 不 是 连续 的 ， 但 线性 


地 址 必须 是 连续 的 ， 这 就 够 了 了。 处 理 器 访问 数据 、 取 指令 ， 用 的 是 线性 
地 址 ， 只 要 线性 地 址 从 类 至 尾 十 连续 有 的 ， 页 部 件 目 会 生成 正确 的 物理 地 
le 


最 后 ， 程 序 的 加 载 必 须 从 线性 地 址 0x00000000 开始 ， 也 就 是 说 ， 必 
须 从 整个 虚拟 地 址 空间 的 起 始 处 开始 加 载 。 这 是 不 合理 的 ， 但 在 本 书 
中 ， 只 能 这 么 做 。 原 因 是 ， 首 先 ， 处 理 器 始终 要 按 段 地 址 加 偏 移 量 的 方 
法 访问 内 存 ， 这 是 不 变 的 ， 在 多 上 段 模型 下 ， 上 有 段 内 元 素 的 偏 移 量 都 是 相对 
于 段 的 开始 处 。 在 程序 加 载 后 ， 段 描述 符 中 的 基地 址 ， 束 是 段 实 际 加 载 
的 位 置 。 也 正 是 因为 如 此 ， 多 段 模型 下 ， 不 管 段 加 载 到 哪里 ， 都 不 会 影 
啊 到 段 内 元 系 的 访问 ， 这 就 是 多 上 段 模 型 下 程序 可 以 浮动 和 重 定 位 的 根本 
原因 。 

相反 地 ， 在 平坦 模型 下 ， 名 义 上 是 不 分 段 ， 但 实际 上 是 只 分 一 个 大 
上段。 在 这 种 情况 下 ， 不 管 程序 实际 上 加 载 到 哪里 ， 代 码 段 、 数 据 段 和 栈 
段 ， 其 描述 符 的 基地 址 都 固定 为 0x00000000。 这 样 一 来 ， 利 用 段 机 制 实 
现 程序 的 译 动 和 重 定 位 就 不 可 能 

举 个 例子 ， 在 我 们 的 代码 清单 16-2 中 ， 程 序 的 入 口 点 位 于 程序 内 偏 
移 量 为 0x04 的 地 方 。 要 取得 它 的 数值 ， 需 要 使 用 指令 


mov ebx, [0x04] 


在 多 上段 模 型 下 ， 数 据 段 摘 述 人 符 中 的 其 地址， 束 是 数据 段 在 内 存 中 的 
起 始 地 址 。 如 果 程 序 加 载 后 ， 数 据 段 的 基地 址 是 0x00200000， 那 么 ， 这 
条 指令 执行 时 ， 处 理 器 发 出 的 地 址 就 是 0x00200004， 这 是 没有 问题 的 。 


然而 ， 在 平坦 模型 下 ， 代 人 码 段 、 数 据 段 和 栈 段 揪 述 符 的 基地 址 固定 
为 0x00000000， 而 不 定 程 序 实 际 上 加 载 到 哪里 。 因 此 ， 同 样 的 指令 执行 
时 ， 处 理 器 发 出 的 地 址 是 0x00000004 ， 而 不 是 正确 的 地 址 
0x00200004。 


在 流行 的 操作 系统 上 工作 ， 编 与 的 程序 必须 符合 一 定 的 规范 才能 实 
现 序 动 和 重 定位 。 比 如 ， 为 了 在 平坦 模型 下 实现 数据 和 代码 的 重 定位 ， 
很 多 系统 要 求 用 户 程 序 近 供 一 个 标准 的 重 定 位 表 ， 列 出 所 有 需要 动态 重 
定位 的 元 系 。 程 序 加 载 后 ， 操 作 系 统 会 找到 此 表 ， 用 实际 的 加 载 位 置 修 
下 每 一 个 表 项 。 


这 古 非 芝 复杂 的 ， 而 且 显然 已 经 超出 了 本 书 的 主题 和 范围。 因此， 我 
们 要 求 ， 程 序 上 必须 加 载 到 任务 虚拟 地 址 空间 的 起 始 处 。 


从 多 上 段 模型 转移 到 平坦 模型 上 工作 ， 一 开始 会 个 太 适 应 。 这 没有 什 
么 好 报 候 的 ， 等 你 有 了 一 定 的 编程 经 验 之 后 ， 会 发 现 多 段 模型 简直 是 非 
妾 糟 烷 的， 要 在 多 个 段 之 间 换 来 换 去 ， 一 会 儿 束 迷糊 了 。 相 比 之 下 ,， 平 
坦 模型 非常 傈 单 ， 编 程 思路 非常 清晰 ， 用 起 来 非 第 富 服 。 当 然 ， 代 价 束 
是 需要 铬 外 的 香 定 位 处 理 。 不 过 ， 那 是 操作 系统 和 编译 如 的 工作 ， 而 不 
征 软 件 开 肥 人 员 的 。 


16.5.5 ” 段 拉 述 符 的 创建 《〈 平 坦 模型 ) 


第 644 一 652 行 ， 在 内 核 的 地 址 空间 内 分 配 内 存 ， 创 建 用 户 任务 的 
TSS。 任 务 症 由 内 核 管理 的 ， 为 了 能 够 访问 得 到 它 ， 必 须 将 其 创建 在 内 
核 的 虚拟 地 址 空间 里 。 为 了 后 面 的 代码 访问 TSS，TSS 的 线性 基地 址 要 
登记 到 任务 控制 块 TCB) 中 。 


第 655 一 658 行 ， 创 建 用 户 任 务 的 局 部 描述 人 符 表 (LDT) 。LDT 是 任 
务 私 有 的 ， 要 在 它 自己 的 虚拟 地 址 空间 里 分 配 所 需要 内 存 空间 。 为 了 后 
面 的 代码 访问 LDT，LDT 的 线性 基地 址 要 登记 到 任务 控制 块 (CTCB ) 
中 。 

第 661 一 667 行 ， 创 建 用 户 任 务 的 代 但 段 摘 述 符 ， 并 登记 到 LDT 中 。 
从 程序 中 可 见 ， 人 代码 段 摘 述 符 中 的 基地 址 是 0x00000000， 段 界限 值 是 
0x000FFFFF， 粒 度 为 4KB， 因 此 ， 实 际 使 用 的 界限 值 是 OxFFFFFFFF 。 
用 户 任 务 的 特权 级 别 是 3， 因 此 ， 代 码 段 描述 符 的 特权 级 别 也 是 3， 段 选 
择 子 的 特权 级 别 也 设置 成 3。 

第 669、670 行 ， 将 代码 段 描述 符 的 选择 子 登 记 到 任务 状态 段 
(TSS) 中 。TSS 的 线性 地 址 是 从 任务 控制 块 (TCB) 中 取得 的 。 

第 673 一 679 行 ， 创建 用 户 任 务 的 数据 段 描述 符 。 和 代码 段 描述 符 
一 样 ， 基地 址 为 0x00000000， 段 界限 也 是 0x000FFFFF， 粒 上 度 为 4KB。 
摘 述 符 特 权 级 和 段 选择 子 的 特权 级 都 是 3。 


在 平坦 模型 下 ， 段 寄存 器 DS、ES、FS 和 GS 都 指向 同一 个 4GB 数 
据 段 。 因 此 ， 第 681 一 685 行 ， 将 刚才 生成 的 数据 段 摘 述 符 选择 子 填 写 到 
TSS 的 DS、ES、FS 和 GS 寄存 器 域 中 。 

在 平坦 模型 下 ， 段 只 是 容器 ， 很 大 的 容器 。 之 所 以 要 将 段 定 义 成 
4GB 大 小 ， 是 希望 可 以 发 出 任何 虚拟 地 址 ， 而 不 会 被 段 部 件 的 检查 机 制 
了 咀 措 。 当 然 了 ， 骗 得 过 段 部 件 ， 骗 不 了 页 部 件 。 容 姻 是 很 大 ， 但 是 ， 能 


不 能 合 到 东西 ， 归 看 你 手 伸 到 的 地 方 有 没有 东西 。 因 此 ， 访 问 一 个 虚拟 
由 存 位 置 忆 前， 必须 提 前 在 那里 分 配 页 。 


在 平坦 模型 下 ， 栈 段 也 要 和 其 他 段 共 享 4GB 的 虚拟 内 存 空间 。 用 户 
任务 的 数据 段 是 3 特权 级 别 的 ， 而 该 任务 回 有 的 栈 也 是 3 特权 级 别 的 ， 可 
以 把 上 面 的 数据 段 选 择 子 赋 给 段 寄 人 存 嚣 SS， 把 数据 段 作 为 栈 段 来 用 。 真 
的 可 以 吗 ? 答 宗 是 ， 完 全 可 以 。 尽 管 一 般 来 说 数据 段 是 同上 扩展 的 ， 而 
栈 段 是 同 下 扩展 的 ， 但 是 ， 同 上 和 问 下 ， 并 不 是 用 来 限制 压 栈 和 出 栈 操 
作 ， 而 是 规定 处 理 占 段 部 件 检 查 段 界限 的 方法 。 如 果 把 同上 扩展 的 数据 
段 作 为 栈 来 用 ， 那 么 ， 每 当 执 行 隐 式 的 栈 操作 指令 时 (push、pop、 
call、ret 和 iret) ， 处 理 右 的 段 部 件 按 同 上 扩展 的 段 来 检查 段 界限 ， 指 令 
的 执行 过 程 和 栈 的 推进 方向 依然 不 变 ， 是 同 低 地 址 方 癌 的 。 


我 们 说 了， 上 有 段 是 容 右 ， 有 4GB 大 小 ， 但 必须 提前 分 配 页 给 那些 要 访 
问 到 的 地 方才 行 。 在 我 们 的 用 户 程序 〈 人 代码 清 单 16-2) 中 ， 仅 有 数据 和 
代码 ， 没 有 定义 栈 空 间 。 所 以 ， 定 义 了 4GB 的 栈 段 后 ， 还 要 分 配 实 际 的 
栈 空 间 才 行 。 第 688 一 690 行 ， 在 用 户 任务 自己 的 虚拟 地 址 空间 内 分 配 内 
存 ， 分 配 了 4KB， 所 以 用 户 任务 的 固有 栈 就 是 4KB。 第 692 一 695 行 ， 将 
CX 寄存 器 中 的 数据 段 选 择 子 填写 到 TSS 的 SS 寄存 器 域 中 ， 同 时 ， 填 写 
TSS 的 ESP 寄存 需 域 。 由 于 栈 从 内 存 的 高 问 回 低 问 推进 ， 所 以 ，ESP 寄 
存 器 域 的 内 容 被 指定 为 TCB 中 的 下 一 个 可 分 配 的 线性 地 址 。 

接 下 来 是 创建 0、1、2 特权 级 的 栈 。 坚 无 疑问 ， 这 三 个 栈 段 的 基地 
址 也 是 0x00000000 ， 也 要 创建 为 同上 扩展 的 数据 段 ， 段 界限 为 
0x000FFFFF， 镁 度 为 4KB。 当 然 ， 这 三 个 栈 段 ， 其 描述 符 的 特权 级 别 不 
辣 ， 段 选择 子 也 不 一 样 。 第 698 一 749 行 就 是 用 来 创建 这 三 个 栈 段 的 代码 
的 ， 很 好 懂 ， 不 再 一 一 解释 。 

堆 至 现在 ， 用 户 程 序 已 经 加 载 ， 相 关 的 段 描述 符 已 经 创建 ， 如 图 16- 
26 所 示 。 


FFFFFFFF | | 
内 存 空 油 


> CS Ss, DS ES, FS、 GS 





00000000 


图 16-26 用户 任 务 的 虚拟 内 存 空间 布 局 图 


16.5.6 ” 重 定 位 U-SALT 并 复制 页 目录 表 


义 到 了 重 定 位 SALT 表 的 时 候 了 ， 第 753 一 794 行 是 重 定 位 SALT 的 
代码 。 这 上段 程序 不 管 是 在 哪 一 章 ， 都 只 有 两 行 不 一 样 ， 其 余 都 一 模 一 
样 ， 没 有 变化 。 有 具体 到 本 章 中 ， 这 两 行 是 


T61 mov ecx, [es:0x0c] ;U-SALT 条 目 数 
762 mov edi, [es:0x08] ;U-SALT 在 4GB 空间 内 的 偏 移 


由 于 使 用 了 平坦 模型 ， 而 且 局 动 了 分 页 功能 ， 所 以 ， 可 以 直接 访问 
用 户 程序 的 虚拟 内 存 空 间 ， 从 中 取得 SALT 表 的 条 目 数 和 线性 地 址 (4GB 
段 内 偏 移 量 ) 。 


第 797 一 803 行 ， 创 建 LDT 描述 符 ， 并 登记 在 GDT 中 。 处 理 郝 要 求 
LDT 摘 述 符 必 须 登 记 在 GDT 中 。 

第 805 一 820 行 ， 填 写 任 务 状 态 段 (TSS) 的 其 余部 分 。 包 括 LDT 选 
择 子 域 、VO 位 映射 区 的 偏 移 地 址 、 前 一 任务 的 TSS 链接 域 、TSS 的 界 
限 、EIP 和 EFLAGS 寄存 占 域 。 特 别 要 提 到 的 是 ，EIP 域 填 写 的 是 用 户 
程序 的 入 口 点 ， 这 很 重要 ， 从 内 核 任 务 切换 到 用 户 任 务 时 ， 是 用 TSS 中 
的 内 容 恢复 现场 的 ， 所 以 这 关系 到 任务 应 该 从 哪里 开始 执行 。EFLAGS 
域 的 内 容 是 当前 内 核 任 务 EFLAGS 寄存 器 的 副本 。 

第 823 一 828 行 ， 创 建 TSS 摘 述 符 ， 并 登记 到 GDT 中 。 处 理 磺 要 求 
TSS 描述 符 必 须 登记 在 GDT 中 。TSS 描述 符 的 特权 级 DPL 必须 是 0， 只 
有 当前 特权 级 别 为 0 的 程序 才能 转换 到 该 任务 。 因 为 任务 切换 应 当 由 内 核 
发 起 ， 而 特权 级 为 1、2 或 3 的 程序 一 般 不 允许 主动 发 起 任务 切换 。 


现在 ， 几 乎 所 有 的 工作 都 完成 了 ， 剩 下 的 事情 ， 融 是 创建 属于 用 户 
任务 目 己 的 页 目录 表 。 羊 竞 ， 你 只 是 临时 信用 了 内 核 任 务 的 页 目录 表 ， 
当 用 己任 务 真正 开始 执行 时 ， 它 个 可 能 还 使 用 内 核 的 页 目录 表 ， 那 太 不 
像 话 了 。 


我 们 说 过 ， 创 建 用 户 任 务 时 ， 使 用 内 核 的 页 目录 表 ， 然 后 ， 有 再 复制 
它 ， 作 为 用 户 任 务 的 页 目录 表 。 页 目录 表 的 复制 工作 是 调用 过 程 
create_copy_cur_pdir 完成 的 。 访 过程 位 于 第 406 行 ， 属 于 公共 例 程 段 。 


第 416 一 418 行 ， 先 令 段 寄存 器 DS 和 ES 都 指向 0 一 4GB 数据 段 。 说 
实话 ， 如 果 内 核 也 工作 在 平坦 模型 下 ， 就 不 用 这 么 麻烦 了 。 


要 创建 页 目录 表 ， 那 当然 先 得 分 配 一 个 空 亲 页 。 第 420 行 ， 首 先 调 
用 过 程 allocate_a 4k_page 分 配 一 个 页 ， 页 的 物理 地 址 由 EAX 寄存 需 返 
加。 第 422 行 ， 将 页 物理 地 址 的 低 12 位 改 成 属性 ， 属 性 值 为 0x007， 
由，US 二 1， 人 允许 特权 级 别 为 3 的 用 户 程 序 访问 该 页 ; RW 二 1， 页 是 可 
读 可 写 的 ; P= 二 1， 页 位 于 物理 内 存 中 。 

为 了 能 够 访问 到 该 页 ， 我 们 把 它 的 物理 地 址 登记 到 当前 页 目录 表 的 
倒数 第 2 个 目录 项 。 我 们 知道 ， 当 前 页 目录 表 的 线性 地 址 是 
0xFFFFF000， 它 的 倒数 第 2 个 目录 项 在 表 内 的 偏 移 量 为 0xXFF8。 因 此 ， 


页 目录 表 内 倒数 第 2 个 目录 项 的 线性 地 址 是 0xFFFFFFF8， 第 423 行 ， 将 
附加 了 属性 的 页 地 址 登记 到 该 目录 项 。 


要 访问 这 个 新 的 页 目录 表 ， 必 须知 道 它 的 线性 地 址 。 事 实 上 ， 它 的 
线性 地 址 是 0xFFFFE000。 事 情 是 这 样 的 ， 让 我 们 倒 过 来 分 析 一 下 。 首 
先 ， 线 性 地 址 0xFFFFE000 有 的 页 目录 索引 值 是 0x3FF， 指 同 当 前 页 目录 
表 的 最 后 一 项 ， 页 表 索 引 值 为 0x3FE， 是 页 表 内 倒数 第 2 项 ， 存 放 的 是 页 
地 址 。 要 知道 ， 当 前 页 目录 的 最 后 一 个 目录 项 ， 存 放 的 是 页 目录 表 目 己 
的 物理 地 址 ， 页 表 束 是 当前 页 目录 表 自 己 ， 而 倒数 第 2 个 目录 项 ， 叉 是 新 
页 目录 表 的 物理 地 址 。 这 就 证 明了 ，0xFFFFE000 的 确 是 新 页 目录 表 的 
线性 地 址 。 


既然 两 个 表 的 线性 地 址 都 有 了 ， 那 么 ， 使 用 禹 rep 有 前缀 的 movsd 指 
令 做 表 间 复制 工作 最 为 方便 。 第 425 一 429 行 ， 按 处 理 器 的 要 求 ， 设 置 好 
ESI 和 EDI 寄存 需 ， 分 别 令 它 们 指 回 当前 页 目录 表 和 新 页 目录 表 ; 设置 
ECX 寄存 器 的 内 容 为 传送 的 次 数 ( 目 录 项 数 ) ; cld 指令 设置 传送 的 方 
同 为 正 同 ， 即 ，ESI 和 EDI 在 每 次 传送 后 人 违 增 。 最后， 执行 movsd 指 
令 ， 目 动 进行 复制 工作 。 


复制 工作 完成 后 ， 控 制 返 回 到 第 833 行 。 在 那里 ， 将 新 页 目录 表 的 
物理 地 址 填写 到 用 户 任 务 TSS 的 CR3 寄存 器 域 中 。 


最 后 ，ret 8 指令 从 栈 中 弹出 参数 ， 并 返回 到 第 1069 行 。 


在 多 任务 环境 下 ， 可 以 创建 多 个 用 户 任 务 ， 使 它们 同时 运行 。 如 多 
16-27 所 示 ， 每 个 任务 都 拥有 目 己 独立 的 4GB 虚拟 地 址 空间 ， 而 且 互 相 
隔离 。 其 中 ， 前 2GB 属于 任务 的 私有 地 址 空间 ， 电 2GB 是 所 有 任务 共有 
的 全 局 地 址 空间 ， 殴 射 到 内 核 的 地 址 空间 内 。 


每 个 任务 都 有 目 己 独立 的 页 目录 表 和 页 表 ， 页 目录 表 的 前 半 部 分 对 
应 痢 任务 虚拟 地 址 空间 的 前 2GB， 后 半 部 分 则 映射 到 内 核 的 页 表 。 这 
样 ， 当 任务 在 自己 独立 的 局 部 空间 工作 时 ， 使 用 它 自 己 的 页 表 ; 当 任 务 
请 求 系统 服务 时 ， 用 的 则 是 内 核 的 足 表 ， 访 问 的 古 内 核 的 代码 和 数据 。 


我 相信 ， 用 这 幅 图 作为 最 后 的 总 绍 ， 可 以 使 读者 更 清楚 地 在 脑海 中 
勾勒 出 分 页 机 制 下 的 虚拟 内 存 分 配 全 景 ， 进 一 步 加 深 对 多 任务 、 分 忠和 
虚拟 内 存 分 配 原 理 的 理解 。 


16.5.7 切换 到 用 户 任 务 执行 


第 1069 一 1072 行 ， 先 显示 一 条 消息 ， 告 诉 屏幕 前 的 人 ， 正 在 执行 任 
务 切换 。 接 着 ， 使 用 call 指 令 发 起 任务 切换 。call 指令 的 参数 是 TCB 中 的 
TSS 选择 子 。 任 务 切 换 时 ， 内 核 任 务 的 状态 被 保存 到 当前 的 TSS 中 ， 接 
者 ， 找 到 用 户 任 务 的 TSS， 从 中 取出 各 种 参数 ， 加 载 到 处 理 噩 的 各 个 寄 
存 器 中 ， 包 括 CR3 寄存 器 、LDTR、 段 寄存 器 、 指 令 指 针 和 栈 指 针 寄 存 
癸 、 通 用 寄存 噩 等。 于 是 ， 用 户 任 务 就 开始 执行 了 。 


FFFFFFFF r--------- 
7FFFFFFF HH- 一 -一 一 -一 -一 = 
局 部 空间 物理 内 存 
2GB 
Xe 
各 任务 共有 的 全 局 页 目录 


程序 管理 器 任务 
2GB 


空间 ， 以 及 内 核 的 本 页 表 


80000000 


. 4KB 页 (未 分 配 ) 
任务 B 
Re | 4KB 页 
全 局 空间 
20B 页 目录 
= 


7FFFFFFF lew 


局 部 空间 
2GB 





00000000 


图 16-27 ”多 任务 环境 下 的 页 目录 表 和 页 表 映 射 示 意图 


来 看 代码 清单 16-2。 
第 46、47 行 ， 显 示 字 符 串 ， 表 示 任 务 当 前 正 工 作 在 页 功能 开局 的 状 
态 下 。 


接着 ， 第 49 一 59 行 ， 以 十 六 进 制 的 形式 ， 显 示 当 前 任务 4GB 虚拟 地 
址 空间 内 的 前 88 个 双 字 。 每 次 先 显 示 两 个 空格 ， 然 后 再 显示 双 字 的 值 ， 
这 样 形成 的 效果 是 每 行 8 个 双 字 ， 共 11 行 。 如 图 16-28 所 示 ， 这 是 当前 
任务 的 运行 结果 。 

空格 字符 串 在 第 38 行 ， 用 标号 space 声明 ， 并 初始 化 为 3 字 节 。 空 
格 的 ASCI 码 为 0x20， 因 此 ， 这 一 行 等 效 于 


space db ′ 和 和 “0 


结合 代码 清单 16-2， 再 来 看 屏幕 上 显示 的 内 容 。0x0001F88E 是 用 
户 程 序 的 总 长 上 度 ， 即 129166 字 市 ; 第 2 个 双 字 是 0x1F85B， 是 用 户 程序 
的 入 口 点 ;第 3 个 双 字 是 0x00000010， 这 是 U-SALT 表 的 起 始 线性 地 址 ; 
第 4 个 双 字 是 0x000001F8， 这 是 U-SALT 表 的 条 目 数 。 不 要 忘 了 ， 我 们 
在 SALT 表 的 中 间 插 入 了 以 下 语句 : 


reserved times 256*500 db 0 ;保留 一 个 空白 区 ， 以 演示 分 页 


这 直接 导致 多 出 500 个 表 项 。 加 上 原 有 的 4 个 表 项 ， 共 
504〈0x000001F8) 个 表 项 。 


岂 LEARN-ASM [正在 运行 ] - Oracle VM VirtualBox |eIl % 


is enabled .System core is 
SUstem wide CALL-GATE mounted. 
1 .8 @ 


由 全 四 了 二 故人 乓 于 全 正和 各 Lh paging enabledt? 

OOO1F88BFE 1000 00000 00 0 00 N00 010900 

010101019) O0001000 0 O00 00 0100 0000 0 000 O00 00 0 00 O00 0 0 0 0.000 00 000 

OC IO 0 99609 O10.0101010.0 0600660000 0900000000 “0000600006 “00600006000 0060000009 
OIOIOIOIO 069000000606 ”09090000006 09000600009 000000009009 909099 

( ) QOQOQOO0O OOOOOOOOGO OfC 
000600000 人 
OC 000 


IJ900 “060000000 00000009 
IO0600 ”60660000600 0006000000 
JIOOOOO00 OO 
QQOC 


QO00000 QO0000000 
IDDOO009 9099009000 昌 
IDDO0O0000 90990090000 





OF 9 Right ctrl 


图 16-28 ”本 章程 序 的 运行 结 来 截图 














从 源 程 序 中 可 知 ， 紧 接着 显示 的 是 U-SALT 表 的 内 容 。 不 过 ， 每 个 表 
项 的 前 6 字 节 已 经 被 内 核 改 成 调用 门 选 择 子 和 偏 移 量 了 。SALT 表 的 内 容 
是 按 字 节 定 义 的 ， 当 按 双 字 值 显示 在 屏 禹 上 时 ， 会 显得 顽 倒 错乱 ， 请 读 
者 在 有 时 间 的 情况 下 目 行 分 析 。 

第 61 行 ， 将 控制 返回 到 内 核 中 。 

回 到 代码 清单 16-1。 

控制 返回 到 代码 清单 16-1 的 第 445 行 。 在 那里 ， 先 根据 EFLAGS 寄 
存 器 的 NT 位 ， 判 断 用 己任 务 〈( 当 前 任务 ) 当初 是 怎么 友 起 的 。 如 果 是 由 
call 指令 发 起 的 ， 那 么 ， 就 用 iretd 指令 转换 到 前 一 个 任务 (内 核 ) ; 如 
果 是 由 jmp 指令 发 起 的 ， 则 直接 用 jmp 指令 转换 回 内 核 任 务 。 

无 论 如 何 ， 当 任务 切换 后 ， 一 定 会 转换 回 内 核 任务 ， 因 为 当前 束 两 
个 任务 。 一 旦 内 核 任务 恢复 执行 ， 而 且 执 行 点 在 第 1074 行 ， 紧 接着 当初 
发 起 任务 切换 的 那 条 指令 之 后 。 

第 1074 一 1077 行 ， 内 核 显 示 一 条 消 奶 ， 表 示人 处 理 费 要 仿 机 了。 于 
是 ， 它 说 到 做 到 ， 停 机 。 


16.6 程序 的 编译 、 执 行 和 调试 
16.6.1 本 章程 序 的 编译 和 运行 方法 


分 别 编译 代码 清单 16-1 (c16 core.asm) 和 16-2 (c16.asm) ， 并 
将 编译 后 的 文件 号 入 虚拟 便 往 ， 前 者 从 逻辑 局 区 1 开始 写 入 ， 后 者 从 人 逻辑 
局 区 50 开始 写 入 。 完 成 以 上 两 项 工作 后 ， 局 动 VirtualBox， 就 可 以 观察 
到 运行 结果 。 


16.6.2 察看 CR3 寄存 器 的 内 容 


可 以 在 向 页 目录 基地 址 寄存 器 PDBR 〈 即 控制 寄存 器 CR3) 写 入 页 目 
录 物 理 地 址 后 察看 它 的 内 容 。 方 法 我 们 前 面 讲 过 ， 束 是 使 用 Bochs 的 调 
试 命令 “creg”。 

如 图 16-29 所 示 ， 这 是 在 执行 了 代码 清单 16-1 中 以 下 指令 后 的 控制 
寄存 器 状态 : 


mov eax, Ox00020000 ; PCD=PWT=0 


mOV cr3,eax 


moOV eax, cr0 
or eax,O0x80000000 
mov CrO ea ; 开局 分 页 机 制 


从 图 中 可 以 清楚 地 看 到 ， 由 于 已 经 处 于 分 页 模式 下 〔 必 须要 先 处 于 
保护 模式 ) ， 所 以 CR0 的 PE 位 和 PG 位 都 已 处 于 置 位 状态 ， 控 制 寄 存 器 
CR3 中 的 内 容 是 当前 任务 页 目录 的 物理 地 址 ， 即 ，0x20000，PCD=0， 
页 级 缓存 被 禁用 ; PWT=0， 页 级 通 写 被 禁用 。 








著 Bochs for Windows - Console OG©OGD0 


(EoD Aolololololololo lo Io [oT To ot: lI lolololololololo lo :1 fi 人 : mou eax，cro 
; Qf20c0 
《bochs:157> n 
Next at t=17847105 
9) [96x0000000006040ece] 0038:000000000000048e (unk . : Or eax，DOx80000000 
; 0d00000080 
MN<bochs:158> n 
Next at t=:17847106 
oD RD Aololololololololo Io ol TK lo et: Iolololololololo Iolo SE : mou crO, eax 
; Of22c0 
《bochs:159> s 
Next at t=17847107 
oD [9xo900000600060040ed6] 0038:0060000000000496 (unk . : mou ebx, Qxfffff000 








; bbOOFOFFTFF 


<bochs:160> creg 
CRO-Oxe0000011: PG CD Nu ac wp ne ET ts em mp PE 
A 401olo Tolololololo nololololole 
eb Aolololololololololo paololole] 
PCD=page-level cache disable:0 
PWT=page-level write-through:0 
CR4=DOx00000000: smep osxsave pcid fsgsbase smx vmx osxmmexcpt osfxsr pce pge mce 
pae pse de tsd pvui ume 
CR8: QOxO 
EFER=Ox60000000: ffxsr nxe lma lne SCce 
《bochs:161> 。 


图 16-29 开启 了 分 页 模式 后 的 控制 寄存 器 状态 


16.6.3 ”察看 线性 地 址 对 应 的 物理 页 信息 


一 旦 进入 分 页 模式 ， 可 以 用 “page” 命 令 察 看 线性 地 址 到 物理 页 的 映 
射 信 息 。 比 如 ， 如 图 16-30 所 示 ， 这 里 显示 了 线性 地 址 0x7e08 所 对 应 的 
物理 页 信息 4UD O 

















徊 Bochs for Windows - console 0 ee = 


rax: 0x00000000_e0600011 rcx : Qx00000000 _QQ000000 
: 0x00000000_06060ff003 rbx: Ox0Q0000000_00021000 
: Ox0Q0000000_00000000 rbp: OQx00000000_00000000 
1: OxQQ000000_00000400 rdi: OQx0Q0000000_0Q0040000 
: Ox0Q0000000_00000000 r9 : Ox0Q0000000_00000000 
: Ox00000000_00000000 r11: OQx00000000_00000000 
.40lololololololo ool [ol lo lo E000lolololo lo ololol Lolololo 
: Ox00000000_0Q0000000 r15: OQx0Q0000000_Q0000000 
: OQx0Q0000000_00000496 
eflags QOx00000086: id vip vif ac um rf nt IOPL:=0 of df If tf SF zf af PF cf 
<bochs:96> 
ICRO=OQxeQOQ00011: PG CD NU ac wp ne ET ts em mp PE 
[dllolololololol ololololololo] 
[ebdololololololololololo was Tolole] 
| PCD=page-level cache disable=0Q 
PWT=page-level write-through=0 
CR4=Qx00000000: smep osxsave pcid fsgsbase smx vmx osxmmexcpt osfxsr pce pge mce | 
pae pse de tsd pvui ume 
CR8: 0x0 | 
EFER=0x00000000: ffxsr nxe lma lme sce 
<bochs:97> page QOx?e08 
PDE: Ox0000000000021003 ps a pcd pwt SWyP 
A010lolololololololol oAolo ke: g pat da pcd put SUyP 
linear page Ox0Q000000000007000 maps to physical page QxQ000000000007009 
I<bochs :98> = 


图 16-30 ” 守 看 线性 地 址 到 物理 页 的 映射 信息 


如 图 中 所 示 ， 与 线性 地 址 0x7e08 对 应 的 页 表 ， 其 物理 地 址 登记 在 页 
目录 表 中 ， 是 作为 页 目录 项 PDE 存在 的 ， 该 目录 项 PDE 的 内 容 是 
0x21003。 即 ， 页 表 的 物理 地 址 是 0x21000。 与 线性 地 址 0x7e08 对 应 的 
物理 页 ， 其 地 址 登记 在 页 表 中 ， 古 作为 页 表 项 PTE 存在 的 ， 访 页 表 项 
PTE 的 内 容 是 0x7003。 这 就 是 说 ， 与 线性 地 址 0x7e08 相对 应 的 页 是 
Ox7000。 














16.6.4 察看 当前 任务 的 页 表 信 息 


可 以 察看 当前 任务 的 页 表 ， 显 示 线 性 地 址 和 物理 地 址 (页 〉 的 全 部 
映射 关系 。 要 做 到 这 一 点 ， 可 以 使 用 Bochs 的 调试 命令 “info tab”。 如 图 
16-31 所 示 ， 这 是 在 本 章 中 初次 进入 分 页 模式 后 ， 页 表 的 信息 。 

如 图 中 所 示 ， 虚 拟 内 存 空间 的 低 端 1MB， 即 线性 地 址 0x00000000 一 
0x000FFFFF， 对 应 着 物理 地 址 0x00000000 一 0x000FFFFF 。 这 是 可 以 
理解 的 ， 因 为 在 初次 进入 分 页 模式 时 ， 我 们 需要 建立 这 低 端 1MB 内 存 空 
间 的 一 一 映射 ， 使 线性 地 址 和 物理 地 址 相同 。 


GE 4 7 er ere Bl 
fy Bochs for Windows - Console , -| [S| | Gem 






Ne 7847106 
(9) [ox00000000600040ed3] 0038:0000000000000493 (unk. ctxt] : mou crg，eax 
; Of22c0 


<bochs:101> n 
at t=: 


prefix 1S string 
1s comman 


Ppp 人 八 
=- 

四 四 四 加 吉 直 加 加 四 中 四 9 
O000000000090 


[strin show state of device specified in string 
eulce [strin string 


ce [s 
bochs:103> Info ta 
(oo Ob A010l0lOlo lolololololo aolololo] 
o> dololololololol0 mob A01010b 动 动 动 动 到 e040l0l0l0lololololololololololololmob dolololololololololold) 二 起 动 动量 
四 exFFceo606-6xfFfcG9fff 91olololololololololoaololoaaohdololololololololololoPs 二 避 
[0 和 起 动 副 动 六 01010 bl O44 动 动 动 动 动 翅 动 到 e04010l0lolololololololo waolololo ob dololololololololololopdA0) 动 动 
<bochs :104 


图 16-31 初次 进入 分 页 模式 后 的 页 表 信 息 


为 了 用 线性 地 址 来 修改 页 表 的 内 容 ， 我 们 把 页 表 当 成 普通 的 页 ， 把 
页 目录 表 当 成 页 表 来 用 。 在 这 种 情况 下 ， 页 表 的 线性 首 地 址 是 
0xFFC00000。 因 此 ，0xFFC00000~0xFFCOOFFF 这 段 4KB 的 线性 地 址 
区 间 对 应 的 是 页 表 的 实际 物理 地 址 0x00021000 一 0x00021FFF。 


为 了 用 线性 地 址 访问 和 修改 页 目录 表 目 己 ， 页 目录 表 的 最 后 一 个 目 
录 项 ， 登 记 的 是 页 目录 表 自 己 的 物理 地 址 。 因 此 ， 页 目录 表 的 线性 地 址 
是 0xFFFFF000。 即 ，0xFFFFF000~0xFFFFFFFF 这 段 4KB 线性 地 址 
区 间 对 应 着 实际 的 物理 地 址 区 间 0x00020000 一 0x00020FFF。 

在 本 章 中 ， 一 旦 通过 单 步 执行 ， 进 入 用 户 程序 执行 后 ， 就 可 以 察看 
用 户 任 务 的 页 表 信 息 。 如 图 16-32 所 示 ， 用 户 程 序 的 页 表 信 息 比 较 庞 大 ， 
但 非常 清楚 地 显示 了 整个 内 存 空间 的 映射 关系， 特别 是 全 局 空间 (内 
核 ) 和 局 部 空间 是 如 何 上 映射 的 。 











中 中 
[ Es ss =_ 





攻 Bochs for Windows CO ”0 -| 


QxQ0018090-0x909018fff -> GxQ00000000081279000-98x090900000090127fff 
bxo00019060-0x00019fff -> 0x0000000000129000-0x0000000000129fff | 





[9 401019 109 lo dclolol-h 动 志 ebp A cb 40l9lclololy Iololol Aelololo lp Aololololololololololed ee] 地 到 
(baololo slols le ob dclol ols sb 0 lelolol [elolol pds [lolo mm bdololololololelololo pd 
OxQ001cO00-Qx0001cfff -> 0x0000000600012f000-0x000000000012ffff 
OxQQO1d000-Qx0001dfff -> GxO000000000131000-0x0000000000131fff 
bxoogteo090-6Oxooolefff -> 0x9000000000133000-0x090000900600133fff 
gxg9991f996-9xoogl1ffff -> 9x90999099006135009-6x980009006099135fff 
baololo waiols lem ob Aclolo Ach a hie eb dollelolol [elolo lh e419 [olo mb aololtlololol lolo lee 
pAol0l pa lollomm ob clolord bi pol lololol Iolololo elelr olo mb 4olololololololololo el el an 过 
bxoog22060-0xooo22fff -> 6xobo000000013d000-0xboo0009060013dfff 
bxooog236006-0xoo9o0214fff -> Ox0O00000000013fF000-0xQ000000000140QfFff 
bx8o9b9000690-0x8oofffff -> 9x96000600900096000-6xo900009000000fffFff 
(op:10 elololo Tom oD + ou lch e401 llolol lelolol oma: [lolomm Aololelelololo lolololt pA | aa 
:10 -> Dxobo0o009000060zbboo-bxooo0ooo0060000z2bfff 
bxS0102000-Dx89102ffFf -> 9x00000006000137000-0x0900000000137fFff 
bxff800066-DxffsSoofff -> 9x0000006600002d600-0x090000000002dfff 
bxffa000690-0xffabgofff -> 0x0000000000021000-0x0000000000021fff 
MBxffFbfeogg-DxffbFefff -> 90xo0060900060001416000-6x099006000600141fFff 
gxffbffoge-Dxffbfffff -> GxQ080600006000020000-0x0000000000020fFff 
bxffcooooo0-DOxffcoofff -> OxO00000000002d000-O0x000000000002dFff | 
Dxffe00090-0xffegoofff -> 6x90000006000021000-0x60900090000021fff 
xfffFfe000-DxffffFefff -> 0xoooboo000000141000-0xoo0000000609141 和 ff 二 四 
exfffffobo-OxffffFffff -> 0Oxo00000066000020000-0xoo0000000000206fFTff 

i<bhochs:6> 下 


J 3 TE ™— "Ss "i EE EE ee 


图 16-32 ”本 重用 户 任 务 的 页 表 信 息 


现在 ， 请 你 根据 本 重 中 用 户 程 序 的 吉 构 ， 结 合 Bochs 所 显示 的 页 表 
言 轧 ， 逐 一 解释 这 些 对 应 关系 的 含义 。 


16.6.5 ”使 用 线性 (虚拟 ) 地 址 调试 程序 


开局 了 分 页 模式 之 后 ， 程 序 开始 使 用 线性 地 址 工作 。 相 应 地 ， 在 调 
试 程 序 时 ， 有 时 候 只 能 知道 线性 地 址 ， 而 不 知道 物理 地 址 。 在 这 种 情况 
下 ，Bochs 允许 你 使 用 线性 地 址 工作 。 


尝 个 俩 了 村 ， 我 们 以 前 一 直 用 “xp" 命 令 来 显示 内 存单 元 的 内 容 。 相 应 
地 ，“x” 命 令 则 显示 一 个 线性 地 址 单元 里 的 内 容 。 如 图 16-33 所 示 ， 当 本 
章 的 用 户 任 务 开 始 执行 后 ， 它 拥有 独立 的 4GB 虚 拟 地 址 空间 。 因 此 ， 我 
们 可 以 用 “x 0x0" 命 令 显 示 当 前 任务 4GB 虚拟 空间 内 的 头 一 个 双 字 。 








0 401010 和 091010 Op 401010 和 一动 翅 动 D0 401010101010 [lolol e100lo 0b 4010 lolole10101010 [oY 一动 上 
op.Aololo pAclololo mo A400 PAOD 二 exo9g9060069060139000-0x0000906000139fff 
[hololoPdEololoiaohdcloioPa 了 ha 二 aololiololoiololioiolonEEisioioloaaohdolsloiolslololoioloiEEio aa 
Ob.A0lolo parA0lolO ob Aol0lo pa A hh D401010101010l0l0 lo lo ete Lololo mo baolololololololololo ef 
OP A0lolo Acolo lo ob OLD 2 hh e40101010l0l0l0l0 lo lo es alolo ob dololololololololol Rio aa 
gx809000000-Dx806ff 咎 下 下 ob 4olololololololololololololololo lob A010101o1o T01101010104 动 动 动 到 
Ox80100000-0Ox8010Q0fff op 40lololololo lololololo pa ololo mo 40lolololololo lola 
Ox80101000-0Qx80101fff eb.Aololololololololololo Aelololo ml ob Aololololololololololo pA aa 
Ob:10nlopAololo mo +t:10 or 动 志 动 D oD 40l010lo lolololololo eololo ob A0lololololololollo 六 二 直下 
0 动武:1010101010 Iel0》> 和 动武 :10101 动 翅 动 W040[0l0lolololololololo pAe lololo ob dololololololololololo pA 二 动量 
oxffa00000- 94 动 牙 -10101 动 志 动 对 e040101010l0lolololololo plolo ob dol0lolololololololol0p 和 全 动 动 
gxffbfe0690-0xffbfefff -> 909x0000000000141600-0x0000000006141 千 咎 f 
[9 有 丰 卫 * 盐 了 050 a 动 了 起 直 直 十 二 olololololiolsliolololoPaolololoaohdololololslolslolololoPdo aa 
09xffcgg90600-DxffcoOoff oh4sjslolslololslolsloloPdslololoaohdolololiolslololoiololoPde aa 
0 电动 起 习 910101010 e044 动 下 汪 010) 动 志 动 Db A01010lolololololololo plolo op 40lololololololololelop 直下 
0Oxffffe000-0xffffefff -> 9xo00000000001410900-0x00000000068141 千 咎 f 
oxffffFFOOO- @X 和 下 咎 咎 咎 咎 千 咎 咎 ob aololololololololololo paolololo nob A0lolololololololololo Ao aa 
<bochs:6> s 
上 Next at t=:18215716 

(090) [90x0600009000135860] 60007:000006000001f866 (unk，ctxt): call far ds:0x10 

动 谎 ololololololol 

《bochs: 了 > x Ox0 

[bochs ] : 

0x00006060600060660 <bogus+ : 9xg9o001f88e 


图 16-33 ”使 用 线性 地 址 显示 内 存 数据 














对 照 本 章 代 码 16-2， 线 性 地 址 为 0 的 地 方 ， 是 程序 的 总 大 小 ， 在 这 里 
征 0x0001f88e。 即 ， 本 章 用 户 程序 的 大 小 是 129166 字 节 。 

除了 在 显示 内 存 数据 的 时 候 使 用 线性 地 址 ， 也 可 以 在 知道 指令 线性 
地 址 的 时 候 ， 用 线性 地 址 设置 断 点 ， 其 命令 是 "lb" 或 者 "vb”"。 其 体 使 用 方 
法 ， 请 使 用 Bochs 的 帮助 命令 “help”(help lb、help vb) 。 


本 章 习 题 


1. 代码 清单 16-2 〈c16.asm) 的 第 47 行 是 通过 调用 门 进入 系统 核心 
显示 字符 串 的 指令 : 
47 eall 人 aresErTnSl 
请 以 访 指 令 的 执行 过 程 为 例 ， 说 明 为 什么 必须 将 系统 核心 映射 到 每 
个 任务 的 4GB 地 址 空间 内 才 行 ? 
2. 修改 代码 清单 16-2〈c16.asm) ， 显 示 当 前 任务 前 50 个 页 面 的 物 


理 地 址 ， 可 以 使 用 现成 的 调用 门 。 提 示 : 必须 在 代码 清单 16- 
1 (c16_core.asm) 中 修改 页 目录 的 访问 属性 。 


3. 〔 选 做 ) 如 末 可 能 的 证 ， 答 试 修改 代码 消 单 16-1， 使 系统 核心 工 
作 在 平坦 模式 下 。 


第 17 草 ”中断 和 腊 和 党 的 处 理 与 抢占 式 
多 任务 


说 实话 ， 在 开始 这 一 章 的 写作 任务 之 前 ， 我 从 来 没有 意识 到 它 这 么 
重要 。 相 反 ， 我 以 为 它 可 以 很 轻松 。 

一 开始 ， 在 我 的 规划 中 ， 还 有 第 18 章 ， 名 字 我 都 想 好 了 ， 叫 “抢占 式 
的 多 任务 轮转 和 调度 "， 而 且 相 信 这 样 的 名 字 会 让 很 多 喜欢 钴 研 的 人 感 兴 
趣 。 


但 是 ， 很 快 我 吏 症 识 到 ， 这 两 章 的 内 容 都 很 单一 ， 而 且 这 些 内 容 互 
相交 又 ， 联 系 很 崇 密 。 想 想 看 ， 抢 占 式 的 多 任务 轮转 ， 是 离 不 开 中 靳 
的 。 因 此 ， 我 决定 把 原 定 的 两 草 合 为 一 革 ， 束 是 这 一 草 。 


中 汤 和 异常 中 断 的 内 容 是 很 重要 的 。 至 少 ， 你 需要 知道 处 理 器 会 引 
发 哪些 寞 党， 在 什么 情况 下 会 引发 异常 ， 这 对 于 编写 正确 的 程序 ， 以 及 
调试 这 些 程序 来 说 ， 是 非常 重要 的 。 但 是 ， 还 记得 上 一 章 的 习题 吗 ? 有 
一 道 题 是 选 做 的 ， 要 求 用 平坦 内 存 模 型 来 改写 系统 内 核 ， 我 突然 想到 这 
是 一 道 非 铝 难 的 习题 ， 也 许 没 有 一 个 初学 者 能 够 完成 这 个 任务 。 进 而 我 
又 想到 ， 如 果 我 把 这 一 章 的 内 核 代 码 写 成 平坦 内 存 模型 的 ， 将 是 一 件 了 
不 起 的 事 。 之 所 以 了 不 起 ， 是 因为 它 可 以 使 读者 们 更 加 深入 地 ， 不 ， 是 
彻 确 地 理解 分 页 机 制 的 原理 。 于 是 ， 我 伦 了 一 天 的 时 间 ， 终 于 把 内 核 代 
码 改 成 了 平坦 模型 。 

然后 ， 我 又 有 发现， 作为 一 本 汇编 语言 教程 ， 宏 (Macro) 是 不 可 或 号 
的 。 绝 大 多 数 的 汇编 语言 编译 需 都 文 持 安 ， 绝 大 多 数 的 教科 书 都 要 着 重 
地 讲 到 宏 。 因 此 ， 不 讲 宏 ， 对 不 起 读者 ， 对 不 起 汇编 语言 。 

穴 过 这 一 半 ， 这 本 书 就 结束 了 ， 让 我 们 开始 吧 。 本 章 的 目标 是 : 

1. 了 人 解 保 护 模 式 下 x86 处 理 器 中 断 和 异常 中 断 的 工作 机 制 ， 知 道中 
上 断 和 有 弄 第 中 断 的 分 类 ， 认 识 中 断 拉 述 符 表 IDT、 中 断 门 和 陷阱 门 。 

2. 使 本 章程 序 完 全 在 平坦 内 存 模型 下 工作 ， 进 一 步 加 深 对 分 页 机 
制 、TLB 以 及 虚拟 地 址 空间 等 概念 的 理解 ， 了 解 在 平坦 内 存 模 型 下 进行 
汇编 语言 程序 设计 的 特点 。 


3. 使 用 硬件 中 断 实施 抢占 式 多 任务 切换 ， 和 彻底 理解 任务 切换 的 原理 
和 过 程 。 在 这 个 过 程 中 ， 学 习 一 种 简单 的 任务 调度 算法 ， 以 及 单 回 链表 
的 遇 历 、 节 点 的 退 加 /插入 /删除 /移动 算法 。 

4. 学 习 宏 汇编 技术 的 应 用 。 

5. 学 习 几 条 新 的 X86 处 理 疾 指令 ， 包 括 lidt、invlpg、bound 和 ud2 


17.1 ”中断 和 异常 
17.1.1 ”中断 和 异 妆 概述 


你 应 该 对 中 靳 并 不 卫生 ， 毕 竞 我 们 已 经 学 习 过 它 的 知识 ， 也 用 它 来 
写 过 程序 。 中 断 和 弄 音 的 作用 十 指示 系统 中 的 东 个 地 方 肥 生 了 一 上 至 事 
件 ， 需 要 引起 处 理 硕 《包括 正在 执行 中 的 程序 和 任务 ) 的 注 是 。 当 中 断 
和 卉 和 帝 及 生 时 ， 和 典型 的 结 末 征 迫 使 处 理 锅 将 控制 从 当前 正在 执行 的 程序 
或 任务 转移 到 为 一 个 例 程 或 者 任务 中 去 。 该 例 程 叫做 中 断 处 理 程序 ， 或 
者 天 各 处理 程 序 。 如 果 是 一 个 任务 ， 则 及 生 任务 切换 。 


1. 中 断 (Interrupt) 
中 新 包括 便 件 中 断 和 软 中 断 。 


便 件 中 断 是 由 外 围 人 硬件 设备 发 出 的 中 断 信 号 引发 的 ， 以 请 求 处 理 喜 
提供 服务 。 当 IO 接口 发 出 中 断 请 求 时 ， 会 被 像 8259A 和 I/O APIC 这 样 
的 中 断 控制 需 收 集 ， 并 发 送 到 处 理 右 。 便 件 中 断 完 全 是 随机 产生 的 ， 与 
处 理 需 的 执行 并 不 同步 。 当 中 断 发 生 时 ， 处 理 需 要 先 执 行 完 当前 的 指 
令 ， 然 后 才 对 中 断 进 行 处 理 。 

软 中 断 是 由 int n 指令 引发 的 中 断 处 理 ，n 是 中 断 号 或 者 叫 关 型 但 。 

2. 有 异常 (Exception) 

异 第 束 古 我 们 在 介绍 16 位 汇编 语言 时 所 说 的 内 部 中 断 。 它 们 是 处 理 
厂 内 部 产生 的 中 断 ， 表 示 在 指令 执行 的 过 程 中 明 到 了 错误 的 状况 。 当 处 
理 需 执行 一 条 非法 指令 ， 或 者 因 条 件 不 具备 ， 指 令 不 能 正 篆 执行 时 ， 将 
引 及 这 种 类 型 的 中 断 。 以 上 上 所 列 的 情况 都 是 开间 情况 ， 所 以 内 部 中 断 叉 
叫 异 第 或 者 异 间 中 断 。 比 如， 在 执行 除法 指令 diWidiv 时 ， 遇 到 了 被 0 除 
的 情况 《除数 是 0) ; 再 比如 ， 使 用 mp 指令 发 起 任务 切换 时 ， 指 令 的 操 
作 数 不 是 一 个 有 效 的 TSS 摘 述 和 从 选择 子 。 

恒利 分 为 三 种 ， 第 一 种 是 程序 错误 异 币 ， 指 处 理 喜 在 执行 指令 的 过 
程 中 ， 检 测 到 了 程序 中 的 错误 ， 并 由 此 而 引发 的 异常。 

第 二 种 是 软件 引发 的 寞 第 。 这 类 异 沼 通常 由 into、int3 和 bound 指令 
主动 有 发起。 这 些 指 令 允 许 在 指令 流 的 当前 点 上 检查 实施 异 稼 处理 的 条 件 


是 个 满足 。 举 个 例子 来 次 ，into 指令 在 执行 时 ， 将 检查 EFLAGS 寄存 项 
的 OF 标志 位 ， 如 末 满 足 为 "全 的 条 件 ， 则 引发 开明 。 

第 三 种 是 机 右 检 公 寞 第 。 这 种 寞 单 是 处 理 桌 型 写 相 天 的 ， 也 束 古 
说 ， 每 种 处 理 故 痢 不 太一 样 。 无 论 如 何 ， 处 理 占 提供 了 一 种 对 健 件 心 片 
由 部 和 总 线 处 理 进行 检查 的 机 制 ， 当 检测 到 有 错误 时 ， 将 引 有 太 些 闫 天 


A 


号 。 

根据 异 币 情 况 的 性 质 和 严重 性 ， 异 第 又 分 为 以 下 三 种 ， 并 分 别 实施 
不 同 的 处 理 。 

e 故 障 (Faults) 。 故 障 通 第 是 可 以 纠正 的 ， 比 如 ， 当 处 理 器 执行 一 
个 访问 内 存 的 指令 时 ， 发 现 那个 段 或 者 页 不 在 内 存 中 CP=0) ， 此 时 ， 
可 以 在 异常 处 理 程序 中 了 予以 纠正 (分 配 内 存 ， 或 者 执行 磁 稚 的 换 入 换 出 
操作 ) ， 返 回 时 ， 程 序 可 以 重新 局 动 并 不 失 连 续 性 。 为 了 做 到 这 一 点 ， 
当 故 障 发 生 时 ， 处 理 需 把 机 峰 状 态 恢 复 到 引起 故障 的 那 条 指令 之 前 的 状 
态 ， 在 进入 异 沼 处理 程 序 时 ， 压 入 栈 中 的 返回 地 址 (CS 和 EIP 的 内 容 ) 
是 指 问 引起 故障 的 那 条 指令 的 ， 而 不 像 通 党 那样 指 问 下 一 条 指令 。 如 此 
一 来 ， 当 中 上 断 返 回 时 ， 将 重新 执行 引起 故障 的 那 条 指令 ， 而 且 不 再 出 错 
(如 果 引 起 异常 的 情况 已 经 妥善 处 置 ) 。 这 意味 着 ， 异 常 并 不 总 是 意味 
独 坏 消 息 ， 相 反 ， 很 多 时 候 ， 它 是 有 益 的 ， 束 像 益 虫 。 如 果 没 有 有 异 负 ， 
虚拟 内 存 管理 将 无 从 谈 起 。 


e| 捉 阱 (CTraps) 。 陷 阱 中 断 通 党 在 执行 了 截获 陷阱 条 件 的 指令 之 后 
立即 产生 ， 如 果 陷 阱 条 件 成 立 的 话 。 陷 阱 通常 用 于 调试 目的 ， 比 如 单 步 
中 断 指令 int3 和 六 出 检测 指令 into。 陷 阱 中 断 人 允许 程序 或 者 任务 在 从 中 断 
处 理 过 程 返 回 之 后 继续 进行 而 不 失 连 续 性 。 因 此 ， 当 此 异常 发 生 时 ， 在 
转 入 异 背 处 理 程序 之 前 ， 处 理 喜 在 栈 中 压 入 陷阱 截获 指令 的 下 一 条 指令 
的 地 址 。 

e 终 | 目 (Aborts) 。 终 止 标志 看 最 严 香 的 错误 ， 诸 如 便 件 错误 、 系 统 
表 (GDT、LDT 等 ) 中 的 数据 不 一 致 或 者 无 效 。 这 类 异 各 总 是 无 法 精确 
地 报告 引起 错误 的 指令 的 位 置 ， 在 这 种 错误 发 生 时 ， 程 序 或 者 任务 都 不 
可 能 重新 启动 。 一 个 比较 典型 的 终止 类 异常 是 “双重 故障 ”( 中 断 号 为 
8) ， 当 发 生 一 次 异 间 后， 处 理 需 在 转 入 该 中 断 的 处 理 程 序 时 ， 又 发 生男 
外 的 异常 《如 该 中 断 处 理 程序 所 在 的 段 不 在 内 存 中 ， 或 者 栈 洲 出 ) 。 对 
于 中 上 断 处 理 程 序 来 说 ， 很 难 从 栈 中 获得 有 关 如 何 纠 正 此 类 错误 的 明确 信 
轧 ， 往 往 是 发 生 极为 重大 的 错误 时 才 伴 随 看 这 种 异 利 ， 所 以 再 继续 执行 


引起 此 有 寞 第 的 程序 或 任务 已 相当 困难 ， 操 作 系 统 通 党 只 能 把 该 任务 从 系 
统 中 抹 去 。 


中 断 和 有 弄 第 安生 时 ， 处 理 融 将 挂 起 当前 正在 执行 的 过 程 或 者 任务 ， 
然后 执行 中 新 和 有 异 蜗 处 理 过 程 。 返 回 时 ， 处 理 堪 恢复 程序 或 者 任务 的 执 
行 ， 而 且 被 打 断 的 程序 或 任务 的 执行 不 失 连 续 性 ， 除 非 遇 到 一 个 终止 类 
型 的 卉 利 。 对 于 示 些 夫 帅 ， 处 理 奉 在 转 入 异 各 处 理 程序 之 前 ， 会 在 当前 
栈 中 压 入 一 个 称 为 错误 代码 的 数值 ， 帮 助 程序 进一步 诊断 寞 第 产生 的 位 
置 和 原因 。 


表 17-1 列 出 了 Intel 处 理 器 在 保护 模式 下 的 中 汤 和 异常 。 


表 17-1 保护 模式 下 的 中 断 和 异常 同 量 分 配 


mm | | 

对 数组 的 引用 超出 边界 
无 效 或 未 定义 的 操作 码 ud 2 指令 ， 或 保护 的 操作 码 
设备 不 可 用 〈 无 数学 协 处 理 器 ) 浮 点 或 者 wait/fwiat 指令 


, | , 任何 会 产生 异常 的 指令 、NMI 
8 #DF 双重 故 隆 le hs 
或 者 硬件 中 断 


协 处 理 器 段 超越 “保留 )。 协 处 理 器 
9 执行 浮 点 运算 时 ， 至 少 有 两 个 操作 数 了 浮 点 指令 
不 在 一 个 段 内 ( 跨 段 ) 
uu |#NP | 有 aff 在 | 故障 加载 段 寄存 器 或 者 访问 系统 自 
栈 段 故 障 栈 操作 或 者 加 载 段 寄存 器 SS 
常规 保护 任何 内 存 引 用 或 其 他 保护 检查 
由 Intel 处 理 器 保留 ， 不 能 使 用 | | 有 | | 


| 3 || 
x87 FPU( 浮 点 处 理 单元 ) 浮 点 处 理 . x87 FPU 浮 点 指令 或 Wait/Fwiat 
#MF | 故障 无 
错误 此 令 
EY 林内 让 数据 引用 


a 错误 代码 如 果 有 的 话 ) 和 来 
#MC | ”机 器 检查 终止 天 本 
源 是 处 理 器 型 号 相关 的 
32~255 | | 用 户 自 定义 的 中 断 | 中断 | | 外 部 中 断 ， 或 者 intn 指令 





当中 汤 和 措 常 友和 生 时 ，NMI 和 弄 第 的 同 量 是 由 处 理 硕 目 动 给 出 的 ; 
硬件 中 断 的 向 量 是 由 MO 中 断 控制 器 芯片 送 给 处 理 器 的 ; 软 中 断 的 向 量 是 
由 指令 中 的 操作 数 给 出 的 。 

从 80486 之 后 开始 ， 处 理 需 内 部 一 般 集 成 了 浮上 点 运算 部 件 Xx87 
FPU， 不 再 需要 安装 独立 的 数学 协 处 理 器 ， 所 以 有 些 和 浮 点 运算 有 关 的 
异常 可 能 不 会 产生 (比如 向 量 为 9 的 协 处理 器 段 超越 故障 ) 。wait 和 
fwait 指令 用 于 主 处 理 器 和 浮 点 处 理 部 件 (FPU) 之 间 的 同步 ， 它 们 应 当 
放 在 浮 点 指令 之 后 ， 以 捕捉 任何 浮 点 异 津 。 


从 1993 年 的 Pentium 处 理 絮 开始 ， 引 入 了 用 于 加 速 多 媒体 处 理 的 多 
媒体 扩展 技术 (Multi-Media eXtension，MMX)， ， 该 技术 使 用 单 指令 多 
数据 (Single-Instruction，Multiple-Data，SIMD) 执行 模式 ， 以 便于 在 
64 位 的 寄存 器 内 实施 并 行 的 整数 计算 。 在 之 后 的 岁月 里 ， 随 着 处 理 絮 的 
更 新 换代 ， 访 项 技术 也 多 次 扩展 ， 第 一 次 扩展 被 称 为 SSE (SIMD 
Extension ) ， 第 二 次 是 SSE2， 第 三 次 是 SSE3。 和 SIMD 有 关 的 异常 是 
从 Pentium II 处 理 器 开始 引入 的 。 


bound (Check Array Index Against Bounds ) 指令 用 于 检查 数组 的 
索引 是 人 否 在 边界 之 内 ， 其 格式 为 


SOUund lo nlS 
BOoUungd T32132 


其 具有 两 个 操作 数 ， 目 的 操作 数 是 寄 仔 喜 ， 包 人 台 了 数组 的 票 引 ;， 源 
操作 数 必 须 指 癌 内 存 位 置 ， 在 那里 包 人 了 两 个 成 对 出 现 的 字 或 者 双 字 ， 
分 列 古 数组 索引 的 下 限 和 上 限 。 如 末 执 行 bound 指 令 时 ， 数 组 的 索引 小 于 
下 标的 下 限 ， 或 者 大 于 下 标的 上 限 ， 则 产生 和 卉 第。 


ud2 (Undefined Instruction ) 指令 是 从 Pentium Pro 处 理 絮 开始 引 
入 的 ， 它 只 有 操作 码 而 没有 操作 数 ， 机 此 代 人 码 为 OF 0B。 


ud2 :机 器 码 OF 0B 
执行 该 指令 上 时， 会 引发 一 个 无 效 操 作 代 有 寞 闸 。 访 指令 没有 别 的 用 
处 ， 和 典型 地 用 于 软件 测试 。 尽 管 江 第 是 用 该 指令 故意 引发 的 ， 但 是 ， 在 
转 入 天 第 处 理 程序 时 ， 压 入 栈 中 的 指令 指针 是 指 同 该 指令 的 ， 而 非 下 一 


条 指令 。 


17.1.2 ”中断 描述 符 表 、 中 断 门 和 陷阱 门 


在 实 模 式 下 ， 位 于 内 存 最 低 端 的 1KB 内 存 ， 是 中 断 向 量 表 (VT) ， 
定义 了 256 种 中 断 的 入 口 地 址 ， 包 括 16 位 段 地 址 和 16 位 段 内 偏 移 量 。 当 
中 断 发 生 时 ， 处 理 器 要 么 目 发 产生 一 个 中 断 癌 量 ， 要 么 从 int n 指令 中 得 
到 中 上 断 问 量 ， 或 者 从 外 部 的 中 断 控 制 需 接 受 一 个 中 断 癌 量 。 然 后 ， 它 将 
该 癌 量 作为 索引 访问 中 断 问 量 表 。 有 具体 的 做 法 是 ， 将 中 断 问 量 乘 以 4， 作 
为 表 内 信 移 量 访 问 中 断 问 量 表 ， 从 中 取得 中 断 处 理 过 程 的 段 地 址 和 偏 移 
地 址 ， 并 转 到 那里 执行 。 


在 保护 模式 下 ， 人 处理 器 对 中 断 的 管理 是 相似 的 ， 但 并 非 使 用 传统 的 
中 断 向 量 表 来 保存 中 断 处 理 过 程 的 地 址 ， 而 是 中 断 描述 符 表 (Interrupt 
Descriptor Table，IDT》〉。 顾 名 思 义 ， 在 这 个 表 里 ， 保 存 的 是 和 中 断 处 理 
过 程 有 关 的 描述 符 ， 包 括 中 断 门 、 陷 阱 门 和 任务 门 。 


任务 门 的 格式 我 们 已 经 在 前 面 的 革 市 里 介绍 过 了 ， 中 断 门 和 陷阱 门 
的 格式 如 图 17-1 所 示 。 


事实 上， 调用 门 、 任 务 门 、 中 断 门 和 陷阱 门 的 摘 述 符 非 党 相似 ， 从 
大 的 方面 来 说 ， 因 为 都 用 于 实施 控制 转移 ， 故 都 包括 16 位 的 目标 代码 段 
选择 子 ， 以 及 32 位 的 段 内 偏 移 量 。 由 图 17-1 中 可 见 ， 中 断 门 和 陷阱 门 仅 
仅 有 一 比特 的 甜 别 。 中 断 门 和 陷阱 门 摘 述 符 只 人 允许 存放 在 IDT 内 ， 任 务 
门 可 以 位 于 GDT、LDT 和 IDT 中 。 


和 实 模 式 下 的 中 断 向 量 表 (VT) 不 同 ， 保 护 模式 下 的 IDT 不 要 求 必 
须 位 于 内 存 的 最 低 端 。 事 实 上 ， 在 处 理 器 内 部 ， 有 一 个 48 位 的 中 断 描 述 
符 表 寄存 器 (Interrupt Descriptor Table Register，IDTR ) ， 保 存 着 中 断 
描述 符 表 在 内 存 中 的 线性 基地 址 和 界限 。 如 图 17-2 所 示 ， 和 GDT 一 样 ， 
因为 整个 系统 中 只 需要 一 个 IDT 束 够 了 了 ， 所 以 ，GDTR 与 IDTR 不 像 
LDTR 和 TR， 没 有 也 不 需要 选择 器 部 分 。 





中 断 门 


31 16 15 14 13 12 Ss 7 5 4 0 





31 16 15 0 


目标 代码 段 描述 符 选择 子 中 断 处 理 过 程 在 目标 代码 段 内 的 偶 移 量 15 一 00 +0 


7 5 地 0 
EE 

31 16 15 0 
目标 代码 段 描述 符 选择 子 中 断 处 理 过 程 在 目标 代码 段 内 的 偏 移 量 15~00 


陷阱 门 
31 16 153 4 1 8 


+4 








D 位 为 0 时 ， 表 示 16 位 模式 下 的 门 ， 用 于 兼容 早期 的 16 位 保护 模式 ; 为 1 时 ， 表 示 32 位 的 门 。 


图 17-1 ”中断 门 和 陷阱 门 描述 从 的 格式 


47 1L6 15 0 


GDTR 32 位 的 基地 址 16 位 的 表 界 限 


47 10 15 0 


IDTR 32 位 的 基地 址 16 位 的 表 界 限 


图 17-2 中断 摘 述 符 表 寄存 器 


这 就 意味 着 ， 中 断 描述 符 表 IDT 可 以 位 于 内 存 中 的 任何 地 方 ， 只 要 
IDTR 指 回 了 它 ， 整 个 中 断 系 统 束 可 以 正 稼 工作 。 为 了 利用 高 速 绥 存 使 处 
理 占 的 工作 性 能 最 大 化 ， 建 议 IDT 的 其 地址 是 8 字 节 对 齐 的 (地 址 的 数值 
能 够 被 8 整除 ) 。 处 理 器 复位 时 ，IDTR 的 基地 址 部 分 为 0， 界 限 部 分 的 
值 为 0xFFFF。16 位 的 表 界 限 值 意 味 关 IDT 和 GDT、LDT 一 样 ， 表 的 大 
小 可 以 是 64KB， 人 但是， 事实 上 ， 因 为 处 理 需 只 能 识别 256 种 中 断 ， 故 通 
币 只 使 用 2KB， 其 他 空余 的 槽 位 应 当 将 摘 述 符 的 P 位 清 零 。 最 后 ， 与 
GDT 不 同 的 是 ，IDT 中 的 第 一 个 描述 符 也 是 有 效 的 。 


如 图 17-3 所 示 ， 在 保护 模 却 下 ， 当 中 断 和 异 利用 生 时 ， 处 理 带 用 中 
断 问 量 乘 以 8 的 结束 去 访问 IDT， 从 中 取得 对 应 的 拉 述 待 。 因 为 IDT 在 内 
存 中 的 位 监 是 由 IDTR 指示 的 ， 所 以 这 很 容易 做 到。 


注意 ， 从 图 17-3 中 可 以 看 出 ， 这 里 没有 车 夸 分 页 ， 也 没有 考 碟 门 插 
述 符 是 任务 门 的 情况 ， 因 为 任务 门 的 处 理 比 较 特 殊 。 中 断 门 和 陷阱 门 中 
有 目标 代码 段 手 述 符 的 选择 了 于， 以 及 上 段 内 仿 移 量 。 取 决 于 选择 于 的 和 
位 ， 处 理 豆 访问 GDT 或 者 LDT， 取 出 目标 代 人 码 段 的 插 述 全。 接 看 ， 从 日 
标 代 公 段 的 手 述 从 中 取得 目标 代 人 码 段 所 在 的 基地 址 ， 骨 同门 插 述 从 中 的 
仿 移 量 相 加 ， 束 得 到 了 中 断 处 理 程序 的 32 位 线性 地 址 。 如 果 没 有 开局 分 
页 功能 ， 该 线性 地 址 融 是 物理 地 址 ; 否则 ， 送 页 部 件 转换 成 物理 地 址 。 
注意 ， 当 处 理 器 用 中 断 癌 量 访 问 IDT 时 ， 要 访问 的 位 置 超出 了 IDT 的 界 
限 ， 则 产生 钊 规 保护 弄 帝 〈#GP) 。 


| | 


代码 段 中 断 处 理 过 程 


GDT/LDT 


处 理 融 
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图 17-3 ”保护 模式 下 的 中 断 处 理 过 程 示意 


17.1.3 中断 和 异常 处 理 程序 的 保护 





和 通过 调用 门 实施 的 控制 转移 一 样 ， 处 理 需 要 对 中 新 和 腊 利 处 理 程 
序 进行 特权 级 保护 。 当 目标 代码 段 描 述 符 的 特权 级 《可 以 用 门 描述 符 中 
的 段 选 择 子 ， 从 GDT 或 LDT 中 找到 ) 低 于 当前 特权 级 CPL 时 ， 即 ， 在 数 
值 上 ， 


CPL 雪 目标 代码 段 的 DPL 


时 ， 不 允许 将 控制 转移 到 中 断 或 异常 处 理 程 序 ， 违 反 此 规则 将 引发 币 规 
保护 异常 (#GP) 。 


不 过 ， 中 断 和 弄 第 处 理 程序 的 特权 级 保护 也 有 一 些 特别 之 外 。 上 其 体 
表现 在 : 


e 因 为 中 断 和 异常 的 向 量 中 没有 RPL 字段 ， 故 当 处 理 器 进入 中 断 或 异 
第 处 理 程序 ， 或 者 退 过 任务 门 故 起 任务 切换 时 ， 不 检查 RPL。 


e 中 汤 门 、 陷 阱 门 也 有 上 自己 的 摘 述 符 特 权 级 DPL， 即 门 的 DPL， 参 见 
图 17-1。 但 是 ， 通 常情 况 下 不 针对 该 DPL 进行 检查 ， 除 了 用 软 中 断 int n 
和 单 步 中 断 int3， 以 及 into 引发 的 中 断 和 异常 。 在 这 种 情况 下 ， 当 前 特权 
级 CPL 必须 高 于 ， 或 者 和 门 的 特权 级 DPL 相同 ， 即 ， 在 数值 上 ， 


CPEIL 科 门 描述 符 的 DPL 


这 主要 是 为 了 防止 低 特权 级 的 软件 通过 软 中 断 指令 访问 一 些 只 为 内 
核 服务 的 例 程 ， 如 页 故障 处 理 。 相 反 地 ， 对 于 硬件 中 断 和 处 理 喜 检测 到 
异 昌 情况 而 引发 的 中 断 处 理 ， 不 检查 门 的 DPL。 


中 断 和 水 第 是 随机 产生 的 ， 不 可 预 负 。 但 是 ， 有 一 点 征 可 以 确定 
的 ， 即 ， 它 总 是 有 友 生 在 东 个 任务 内 ， 古 在 东 个 任务 正在 执行 的 时 候 产 生 
的 ， 即 使 整个 系统 内 只 有 一 个 任务 。 


当中 汤 和 有 寞 津 友 生 时 ， 任 务 可 能 正在 特权 级 别 为 0 的 全 局 空间 (内 
核 ) 中 执行 ， 也 可 能 正在 特权 级 别 为 3 的 局 部 空间 内 执行 。 因 此 ， 当 处 理 
锥 将 控制 转移 a 到 中 断 或 腊 音 处 理 程序 时 ， 如 来 处 理 程序 运行 在 较 局 的 特 
权 级 列 上 数值 上 较 低 的 ) ， 那 么 ， 将 转换 栈 : 


ee 根据 处 理 程 序 的 特权 级 别 ， 从 当前 任务 的 TSS 中 取得 线段 选择 于 和 
栈 指针 。 处 理 亏 把 旧 栈 的 选择 子 和 栈 指针 压 入 新 栈 。 毕 竟 ， 中 断 处 理 程 
序 也 是 当前 任务 的 一 部 分 。 


e 处 理 器 把 EFLAGS、CS 和 EIP 的 当前 状态 压 入 新 栈 。 


e 对 于 有 错误 代码 的 异常 ， 处 理 器 还 要 把 错误 代码 压 入 新 栈 ， 紧 换 着 
EIP 之 后 ， 如 图 17-4 (a) 所 示 。 


e 如 果 中 断 处 理 程 序 的 特权 级 别 和 当前 特权 级 别 一 致 ， 则 不 用 转换 
栈 。 
e 处 理 器 把 EFLAGS、CS 和 EIP 的 当前 状态 压 入 当前 栈 。 
e 对 于 有 错误 代码 的 异常 ， 处 理 器 还 要 把 错误 代码 压 入 当前 栈 ， 紧 换 
着 EIP 之 后 ， 如 网 17-4 〈(b) 所 示 。 
处 理 程 序 和 被 中 断 程序 的 栈 


进入 中 断 /异常 处 


理 过 程 之 前 的 ESP 
EFLAGS 
ee 
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进入 中 断 /异常 处 
铬 误 代码 理 过 程 之 后 的 ESP 





(a) 特权 级 别 不 变 时 的 栈 使 用 情况 
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(b) 特权 级 别 变化 时 的 栈 使 用 情况 
图 17-4 ”控制 转移 到 中 断 / 异 第 处 理 程序 时 的 两 种 栈 使 用 情况 


中 断 门 和 陷阱 门 的 区 别 不 大 ， 通 过 中 断 门 进入 中 断 处 理 程序 时 ， 
EFLAGS 寄存 右 的 IF 位 被 处 理 喜 目 动 清 零 ， 以 茶 止 通 辟 的 中 断 ， 当 中 晰 


返回 时 ， 将 从 栈 中 恢复 EFLAGS 寄存 器 的 原始 状态 。 陷 阱 中 断 的 优先 级 
较 低 ， 当 通过 陷阱 门 进入 中 断 处 理 程序 时 ，EFLAGS 寄存 器 的 IF 位 不 
变 ， 以 允许 其 他 中 晰 优先 处 理 。 


EFLAGS 寄存 右 的 IF 位 仪 影响 人 硬件 中 汤 ， 对 NMI、 异 沿 和 intn 形式 
的 软件 中 断 不 起 作用 。 


17.1.4 ”中断 任务 


当中 新 和 姑 单 及 生 时 ， 如 末 根 据 中 断 问 量 从 IDT 中 找到 的 描述 符 是 
任务 门 ， 则 不 是 进行 一 般 的 中 断 处 理 过 程 ， 而 是 发 起 任务 切换 。 如 网 17- 
5 所 示 ， 这 十 退 过 中 断 友 起 任务 切换 的 原理 。 


用 中 断 及 起 任务 切换 ， 吾 沉 上 的 好 处 是 方便 。 比 如 ， 因 为 使 件 中 断 
的 及 生 是 客观 的 ， 很 容易 用 它 来 实现 一 个 剥夺 式 的 、 抢 占 云 的 多 任务 系 
统 〈 人 硬件 调度 机 制 ) 。 

不 过 ， 这 并 不 是 它 最 主要 的 目的 。 想 象 一 下 ， 当 前 任务 正在 执行 的 
时 候 ， 突 然 肥 生 了 终止 英 型 的 卉 弟 ， 比 如 双重 故障 〈#DF) ， 会 禾 么 
样 。 在 这 种 情况 下 ， 要 想 用 iretd 指令 返回 到 那个 任务 继续 正常 执行 已 无 
可 能 。 在 这 种 情况 下 ， 如 果 把 双 香 故障 的 处 理 程序 定义 成 任务 ， 会 非 沼 
恰当 。 当 双重 故 隐 及 生 时 ， 执 行 任务 切换 ， 切 换 到 内 核 任务 中 去 ， 从 容 
地 把 友 生 故障 的 任务 从 系统 中 抹 去 ， 回 收 府 存 空间 ， 并 重新 调度 其 他 任 
务 的 执行 ， 会 古 最 好 的 解决 办 法 。 上 其 体 地 说 ， 在 中断 机 制 中 使 用 任务 门 
可 以 获得 以 下 好 处 : 
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图 17-5 ”通过 中 断 友 起 的 任务 切换 


e 家 中断 的 那个 程序 或 任务 的 整个 执行 环境 可 以 被 完整 地 保存 起 来 
(保存 到 它 的 TSS 中 ) 。 

e 由 于 接管 控制 的 是 一 个 新 的 任务 ， 因 此 ， 可 以 使 用 一 个 全 新 的 0 特 
权 级 栈 。 这 可 以 有 效 地 防止 因 当 前 任务 的 0 特权 级 栈 遭 到 破坏 而 使 系统 裔 
省。 

e 由 于 是 切换 到 一 个 新 任务 ， 因 此 ， 它 有 一 个 独立 的 地 址 空间 。 

当然 ， 和 一 般 的 中 断 处 理 过 程 相 比 ， 利 用 中 断 发 起 任务 切换 也 有 不 
利 的 一 面 ， 那 就 是 速度 很 慢 ， 毕 葛 要 保存 大 量 的 机 桥 状 态 ， 并 进行 一 系 
列 特权 级 和 内 存 访 问 的 检查 工作 。 

因 中 汤 和 异常 而 发 起 任务 切换 时 ， 不 再 保存 CS、EIP 的 状态 ， 但 
是 ， 在 任务 切换 工作 完成 后 ， 处 理 器 要 把 错误 代码 压 入 新 任务 的 栈 中 
(如 果 有 错误 代码 的 话 ) 。 


任务 是 不 可 重 入 的 ， 因 此 ， 在 进入 中 断 任 务 之 后 和 执行 iretd 指令 之 
亲 ， 必 须 关 中 断 ， 以 防止 因 相 同 的 中 断 再 次 发 生 而 产生 和 彰 规 保护 异 负 
(#GP) 。 

作为 对 任务 门 的 保护 ， 和 中 断 门 、 陷 阱 门 一 样 ， 只 对 通过 int3、intn 
和 into 指令 发 起 的 任务 切换 实施 特权 级 检查 ， 即 ， 只 有 在 数值 上 符合 以 
下 条 件 ， 才 允许 通过 以 上 指令 发 起 任务 切换 : 


CPL 志 任务 门 的 DPL 


在 其 他 开 利 和 使 件 中 断 的 情况 下 ， 不 检 碍 任务 门 的 特权 级 。 万 外 ， 
由 于 是 任务 切换 ， 人 不对 目标 代码 段 的 特权 级 列 进 行 检 查 。 


17.1.5 ”错误 代码 


有 些 开 利 产 生 时 ， 处 理 融会 在 开间 处 理 程序 或 中 断 任 务 的 栈 中 压 入 
一 个 错误 代码 。 通 常 ， 这 和 意味 看 卉 利和 特定 的 段 选择 子 或 中 断 问 量 有 
大 。 

如 图 17-6 所 示 ， 压 入 栈 中 的 错误 代 人 码 是 32 位 的 ， 但 高 16 位 不 用 。 


一 一 


3] lw 18 要 这 


图 17-6 ”错误 代 人 码 的 格式 


EXT 位 的 意思 是 ， 弄 剃 古 由 外 部 事件 引 友 的 “(External Event) 。 此 
位 置 位 时 ， 表 示 异 常 是 由 NMI、 硬 件 中 断 等 引发 的 。 

IDT 位 用 于 指示 描述 符 的 位 置 ‘(Descriptor Location ) 。 为 “1 时 ， 表 
示 段 选择 子 的 索引 部 分 (错误 代码 的 位 15~~3) 是 指 问 中 断 描述 符 表 
(IDT》 的 ; 为 "0" 时， 表示 上 段 选 择 子 的 索引 部 分 指 问 GDT 或 者 LDT。 

TI 位 仅 在 IDT 位 是 "0" 的 情况 下 才 有 意义 。 此 位 是 “0 时， 表示 上 段 选 择 
子 的 索引 部 分 指向 GDT， 和 否则 ， 指 向 LDT。 

段 选 择 子 的 索引 部 分 用 于 指示 GDT/LDT 内 的 段 描述 符 ， 或 者 IDT 内 
的 门 描述 符 ， 它 就 是 我 们 平时 所 用 的 段 选择 子 的 高 13 位 。 


有 时 候 ， 错 误 代 人 码 可 能 是 全 零 ( 空 ) ， 这 表示 了 寞 津 的 产生 并 非 由 于 
引用 了 一 个 特定 的 段 。 当 然 ， 也 可 能 确实 是 在 引用 一 个 段 的 时 候 友 生 
的 ， 而 且 由 于 那个 段 的 手 述 人 符 是 空手 述 符 。 所 谓 引 用 一 个 段 ， 退 第 是 执 
行 了 这 样 的 指令 : 


moOV ecx, Ox0008 


moOV ds,ecx 


注意 ， 当 通过 iret/iretd 指令 从 中 上 断 处 理 程序 返回 时 ， 处 理 器 并 不 会 
自动 弹出 错误 代码 。 因 此 ， 对 于 那些 有 异常 代码 的 异常 处 理 过 程 来 说 ， 
必须 在 执行 iret/iretd 指令 前 ， 先 从 栈 中 移 去 (或 弹出 ) 错误 代码 。 人 否 
则 ， 处 理 喜 在 执行 iretiretd 指令 时 ， 加 载 ( 弹 出 〉 到 CS 和 EIP 中 的 返回 
地 址 就 是 错 的 。 

对 于 外 部 异常 (通过 处 理 占 引 脚 触发) ， 以 及 用 软 中 上 断 指令 intn 引 
发 的 异常 ， 处 理 器 不 会 压 入 错误 代码 ， 即 使 它 原本 是 一 个 有 错误 代码 的 
异常 。 分 配给 外 部 中 断 的 向 量 号 在 31 一 255 之 间 ， 出 于 特殊 的 目的 ， 外 
部 的 8259A 或 者 I/O APIC 心 片 可 能 会 给 出 一 个 0 一 19 的 同 量 写 ， 比 如 
13 〈 常 规 保护 异常 #GP) ， 并 希望 进行 异常 处 理 。 在 这 种 情况 下 ， 处 理 
噩 并 不 会 像 通 第 那样 压 入 错误 代码 。 同 样 地 ， 用 软 中 上 断 指 令 


int 0x0oq ; 回 量 号 13， 常 规 保护 异常 #GP 


有 意 引 及 的 异种 ， 也 不 会 压 入 错误 代 但 。 


17.2 ”本章 代码 清单 





17.3 内核 的 加 载 和 初始 化 


17.3.1 彻底 终结 多 段 模型 


平坦 模型 下 也 不 是 没有 段 ， 只 是 所 有 的 段 都 很 大 ， 大 到 等 于 处 理 器 
所 能 寻 址 的 全 部 空间 。 因 此 ， 在 平坦 模型 下 ， 至 少 要 创建 两 个 段 描述 
符 ， 一 个 是 代码 段 ， 另 一 个 是 数据 段 ， 都 是 4GB。 


列 筷 了 ， 主 引导 程序 的 加 载 位 置 是 物理 地 址 0x00007C00， 进 入 保护 
模式 之 后 ， 因 为 不 再 使 用 多 段 模型 ， 所 以 ， 只 能 在 平坦 模型 下 使 用 基地 
址 是 0x00000000 的 代码 段 ， 为 了 继续 执行 程序 ， 指 令 指 针 寄 存 器 EIP 的 
杞 始 内 容 必 须 是 0xX00007C00， 并 在 此 基础 上 随 看 指令 的 执行 而 增加 。 


现在 来 看 代码 清单 17-1 的 第 10 行 ， 为 了 使 程序 在 平坦 模型 下 方便 地 
引用 内 存 地 址 ， 这 里 定义 了 段 mbr， 并 要 求 段 的 虚拟 地 址 从 0x00007C00 
开始 : 


SECTION mohE Vastart=0x00007ec00 


如 果 没 有 vstart 子 句 ， 所 有 标号 的 地 址 都 以 程序 开头 为 基准 ， 从 0 开 
台 计算 ; 一 旦 加 了 了 该 子 句 ， 当 引用 一 个 标号 时 ， 标 号 所 代表 的 地 址 藉以 
程序 开头 为 基准 ， 从 给 定 的 虚拟 地 址 开始 计算 。 

言 归 正 传 ， 痛 先 来 创建 进入 保护 模式 时 用 到 的 段 拉 述 从 ， 这 就 需要 
给 出 GDT 的 物理 起 始 地 址 。 

第 199、200 行 声 明了 标号 pgdt， 并 初始 化 了 6 字 节 ， 分 别 是 GDT 的 
界限 值 和 物理 地 址 。 为 了 在 实 模式 下 准备 全 局 描述 符 表 (GDT) ， 第 12 
一 23 行 ， 从 标号 pgdt 处 取得 GDT 的 物理 地 址 ， 并 计算 它 在 实 模式 下 的 
段 地 址 和 偏 移 地 址 。 

在 第 13 章 里 ，GDT 的 物理 地 址 是 0x00007E00 ， 现 在 是 
0x00008000， 这 正好 是 一 个 页 的 起 始 地 址 。 这 一 变化 和 程序 的 运行 无 
关 ， 我 只 是 觉得 ， 将 GDT 安排 在 页 的 开头 位 置 比较 好 ， 仅 此 而 已 。 


注意 ， 第 17 行 ， 从 标志 pgdt 处 取得 GDT 的 物理 地 址 时 ， 使 用 了 指 
今 


mov eax, [cs:pgdt+0x02] ;GDT 的 32 位 物理 地 址 


当 这 条 指令 执行 时 ， 处 理 亏 工作 在 实 模 式 下 ， 段 寄存 器 CS 的 内 容 为 
0x0000 。 如 果 没 有 那个 vstart 子 句 ，pgdt 的 地 址 是 0x7C00+pgdt。 但 
是 ， 因 为 有 vstart 子 句 ， 所 以 ， 标 号 pgdt 的 地 址 是 从 0x00007C00 开始 
计算 的 ， 不 用 再 加 上 0x7C00。 

天 于 这 段 代码， 没有 什么 好 说 的 ， 很 容 多 理解 ， 己 经 在 第 13 草 里 讲 
解 过 了 ， 不 再 闹 述 。 

第 27 一 32 行 ， 在 GDT 中 安装 最 基本 的 两 个 段 描述 行 ， 一 个 是 4GB 
的 代码 段 ， 另 一 个 是 4GB 的 数据 段 。 段 的 基地 址 都 是 0x00000000， 段 界 
限 也 都 是 0xFFFFF， 粒 度 为 4KB。 当 然 ， 它 们 的 属性 不 同 。 注 意 ， 没 有 
为 主 引导 程序 创建 单独 的 段 拉 述 符 ， 稍 后 你 束 会 看 到 ， 这 实际 上 也 不 需 


机。 


第 35 一 47 行 ， 为 进入 保护 模式 做 准备 。 首 先是 加 载 全 局 描述 符 表 寄 
存 器 (GDTR)，; 然后 ， 打 开 第 21 根 地 址 线 A20; 最 后 ， 设 置 控制 寄存 
器 CR0 的 PE 位 ， 进 入 保护 模式 。 


进入 你 护 模式 后 ， 按 要 求 ， 要 执行 一 条 跳 转 指令 ， 以 消 空 流水线 。 


]mp dword 0x0008:flush 


其 中 ， 标 号 flush 是 下 一 条 指令 在 目标 代码 段 内 的 32 位 偏 移 地 址 。 在 
第 13 章 里 ， 段 选择 子 是 0x0010， 所 指示 的 段 是 “特制 "的 主 引 导 程 序 段 ， 
基地 址 为 0x00007C00， 段 界限 是 0x1FF 。 在 那 时 ，flush 所 代表 的 偏 移 
地 址 是 相对 于 该 段 ， 从 0 开始 计算 的 ， 下 一 条 指令 的 物理 地 址 是 
0x00007C0O0+flush 。 


和 第 13 半 相 比 ， 在 这 里 ,目标 代码 段 是 4GB 的 段 ， 基 地 址 为 
0x00000000 。 由 于 使 用 了 vstart 子 句 ，flush 所 代表 的 偏 移 地 址 是 从 
0x00007C00 开始 计算 的 ， 下 一 条 指令 的 物理 地 址 是 
Ox00000000+flush。 

但 是 ， 实 际 上 ， 在 两 种 执行 环境 下 ， 得 到 的 结果 是 一 样 的 。 


第 54 一 60 行 ， 令 段 寄 存 避 DS、ES、FS、GS 和 SS 都 指 癌 4GB 数 
据 段 。 只 不 过 栈 段 是 同 下 增长 的 ， 其 他 各 段 部 问 上 增长 。 这 样 做 ， 最 耳 


接 的 结果 就 是 ， 从 此 再 也 看 不 到 这 样 的 指令 了 : 


movVv eax, Ox0008 


NOV eS Ear 


原因 是 ， 因 为 所 有 上 段 都 是 4GB 的 ， 用 哪 一 个 都 无 所 谓 。 但 是 ， 这 也 
各 来 了 一 个 最 大 的 好 处 ， 那 就 是 不 用 在 段 之 间 换 来 换 去 ， 也 不 必 记 住所 
操作 的 数据 位 于 哪个 段 。 当 它们 都 位 于 同一 个 4GB 段 时 ， 很 清 碍 。 

第 60 行 的 指令 定义 了 保护 模式 下 的 初始 栈 ， 给 出 了 栈 顶 所 在 的 位 
置 ， 显 然 ， 该 栈 是 从 地 址 0x00007000 开始 向 低地 址 方向 扩展 的 。 如 图 
17-7 所 示 ，GDT 位 于 物理 地 址 0x00008000 处 ; 这 里 定义 的 初始 栈 从 物 
理 地 址 0x00007000 开始 回 下 推进 ， 理 论 上 ， 该 地址 以 下 的 空间 都 可 用 于 
栈 操作 。 另 外 还 可 以 看 出 ， 由 于 当前 正在 执行 的 主 引导 程序 并 不 在 页 的 
上 自然 边界 上 ， 故 ， 在 它 和 GDT、 栈 之 间 出 现 了 间隙 〈 内 存 空洞 ) 。 


第 63 一 89 行 ， 从 硬盘 上 加 载 系 统 内 核 ， 是 从 内 存 物理 地 址 
0x00040000 开始 加 载 的 。 这 上 段 代 人 码 和 第 14 章 一 样 ， 没 有 人 变化。 


内 核 拥 有 自己 独立 的 2GB 内 存 空 间 ， 而 且 还 要 被 映射 到 每 个 任务 的 
高 2GB， 也 就 是 从 地 址 0x80000000 开始 的 地 方 。 为 了 完成 这 种 映射 ， 最 
简单 的 做 法 就 古 在 内 核 代 人 码 中 做 点 手脚 ， 让 所 有 对 内 存 地 址 的 引用 ( 主 
要 是 对 标号 的 引用 ) 都 从 0x80000000 开始 。 


请 看 代 公 痛 捍 17-2， 这 是 修改 之 后 的 内 核 代 人 码 。 对 整个 代码 消音 和 
做 浏览 ， 你 会 肥 现 这 里 只 有 一 个 段 ， 数 据 和 代 但 混合 在 一 起 ， 都 在 同一 
个 段 内 ， 第 25 行 是 定义 这 个 段 的 语句 : 


SECGTLIONM eore vestart 0xe0040000 


除 此 之 外 ， 不 再 有 其 他 段 定义 的 语句 。 你 可 能 会 问 ， 内 核 的 虚拟 地 
址 不 是 0x80000000 吗 ? 怎么 会 是 一 个 奇怪 的 地 址 0x80040000 呢 ? 


能 及 现 这 个 问题 的 人 ， 一 定 是 个 好 区 爱 问 的 人 。 原 因 很 简单 ， 在 前 
一 重 里 ， 内 核 工 作 在 多 段 模型 下 ， 内 核 代 但 和 内 核 数据 的 重 定 位 依赖 于 
段 的 基地 址 。 因 此 ， 在 多 段 模型 下 ， 不 管内 核 加 载 到 内 存 中 的 任何 位 置 
都 能 正常 运行 。 到 了 本 半 ， 内 核 工作 在 平坦 模型 下 ， 不 可 能 再 依赖 段 基 
地 址 实施 重 定 位 。 这 怎么 办 呢 ? 为 了 使 它 能 够 正常 工作 ， 需 要 用 vstart 村 
名 向 编译 器 声明 它 的 虚拟 地 址 。 如 此 一 来 ， 编 译 器 就 知道 如 何 处 理 对 标 


号 地 址 的 引用 。 不 过 ，vstart 子 句 中 给 出 的 虚拟 地 址 必须 和 程序 在 运行 时 
的 虚拟 地 址 相同 。 


如 图 17-8 所 示 ， 内 核 占 据 着 物理 内 存 的 低 端 1MB， 其 核心 部 分 的 加 
载 地 址 是 0x00040000。 在 开局 页 功能 之 后 ， 内 核 需 要 将 目 己 映射 到 从 虚 
拟 地 址 0x80000000 开始 的 高 端 。 这 是 一 个 完整 的 映射 ， 很 自然 地 ， 内 核 
在 高 端的 虚拟 地 址 就 是 0x80040000 了 。 


一 旦 知道 了 内 核 运行 时 的 虚拟 地 址 ， 那 么 ， 内 核 代 码 在 编译 时 ， 
vstart 子 句 的 虚拟 地 址 也 必须 与 之 相同 。 只 有 这 样 ， 内 核 才 能 正常 执行 。 

当然 ， 我 们 知道 ， 当 内 核 运 行 时 ， 不 党 是 执行 内 核 中 的 指令 ， 还 是 
访问 内 核 中 的 数据 ， 段 部 件 所 发 出 的 线性 地 址 都 会 高 于 0x80040000， 正 
好 位 于 每 个 任务 虚拟 地 址 空间 的 高 器 ;而 经 页 部 件 转换 之 后 ， 得 到 的 物 
理 地 址 又 变 为 原始 的 真实 地 址 0x00040000。 


再 回 到 代 人 码 清单 17-1， 半 葛 主 引导 程序 还 在 执行 呢 。 


第 95 一 105 行 ， 创 建 内 核 的 页 目录 表 和 页 表 ， 并 初始 化 必要 的 目录 
项 和 页 表 项 。 如 图 17-7 所 示 ， 页 目录 表 的 物理 地 址 是 0x00020000， 第 
98 行 ， 先 令 最 后 一 个 页 目录 项 指 问 页 目录 表 上 自己 ， 即 ， 该 项 所 对 应 的 页 
表 就 是 当前 页 目录 表 ， 这 是 为 修改 页 目录 表 而 设 的。 接着 ， 在 页 目录 表 
内 创建 两 个 目录 项 ， 分 别 对 应 看 两 个 不 同 的 起 始 线 性 地 址 0x00000000 和 
0x80000000。 但 是 实际 上 ， 它 们 都 指 问 同一 个 页 表 。 其 中 ， 前 一 个 目录 
项 只 在 开启 页 功能 的 时 候 使 用 ， 作 为 临时 过 渡 。 


一 一 
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图 17-7 ”平坦 模型 下 的 内 核 物 理 布局 
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图 17-8 内 核 区 域 从 低下 到 高 咒 的 映射 


页 表 的 物理 地 址 是 0x00021000， 它 的 前 256 个 页 表 项 必须 一 一 对 应 
于 物理 内 存 最 低 端 的 256 个 页 ， 这 是 内 核能 正常 工作 的 基本 要 求 。 第 108 
一 118 行 ， 使 用 循环 来 建立 这 种 一 对 一 的 映射 关系 。 

第 121、122 行 ， 将 内 核 页 目录 表 的 物理 地 址 传送 到 控制 寄存 器 
CR3， 这 是 在 开局 页 功能 之 前 必须 要 做 的 事情 。 

第 125 一 128 行 ， 将 全 局 描述 符 表 (GDT) 映射 到 虚拟 内 存 的 高 端 。 
这 也 是 一 一 映射 ，GDT 的 新 地 址 应 当 是 线性 地 址 0x80000000 加 上 和 它 原 
先 的 地 址 。 

现在 ， 内 核 已 经 从 硬盘 上 加 载 完毕 ， 页 目录 表 和 页 表 也 已 经 创建 。 
看 样子 一 切 都 准备 好 了 ， 第 130 一 132 行 ， 开 启 分 页 功能 。 

现在 已 经 工作 在 分 页 模式 下 ， 和 从 前 不 同 的 是 ， 不 需要 重新 加 载 段 
寄存 器 CS、SS、DS、ES、FS 和 GS 以 刷新 它们 的 描述 符 高 速 缓存 器 ， 
因为 所 有 这 些 段 都 是 4GB 的 。 


关于 在 分 页 模式 下 工作 ， 所 有 该 做 的 工作 都 做 了 ， 但 还 十 忽 略 了 一 
个 问题 ， 那 就 是 内 核 栈 ， 应 当 将 它 映射 到 虚拟 内 存 的 高 问 。 第 137 行 ， 
退 过 把 栈 指 针 寄存 桌 ESP 的 内 容 在 原来 的 基础 上 增加 0x80000000， 来 做 
到 这 一 所 。 


第 139 行 ， 将 控制 转移 到 内 核 。 注 意 ， 这 是 一 个 32 位 段 内 转移 ， 而 
不 是 远 转 移 〈 段 间 转 移 ) ， 在 指令 中 没有 使 用 关键 字 “far。 远 转移 在 段 间 
进行 ， 需 要 16 位 的 目标 代码 段 选 择 子 ， 以 及 32 位 段 偏 移 量 。 在 平坦 模型 
下 ， 所 有 东西 都 在 一 个 大 的 4GB 段 内 ， 从 一 个 地 方 转移 到 另 一 个 位 置 去 
执行 ， 目 然 是 段 内 转移 了 。 

事实 上， 这 条 指令 有 两 个 功能 ， 一 是 转移 到 内 核 去 执行 ， 二 是 将 处 
理 堪 的 执行 流转 移 到 虚拟 内 存 的 高 端 。 内 核 已 经 从 硬盘 上 上 加载， 加载 的 
位 置 是 线性 地 址 0x80040000。 内 核 程序 有 一 个 头 部 ， 记 载 了 内 核 的 大 小 
和 入 口 点 。 参 见 代 码 清 单 17-2 的 第 25 一 30 行 ， 内 核 程 序 内 ， 偏 移 为 
0x00000004 的 地 方 ， 记 载 着 内 核 要 执行 的 第 一 条 指令 的 偏 移 量 ， 但 没有 
段 选择 子 。 

因此 ， 当 这 条 JMP 指令 执行 时 ， 人 处理 器 要 先 访问 当前 代码 段 ， 从 线 
性 地 址 0x80040004 处 取得 一 个 32 位 的 段 内 偏 移 量 ， 传 送 到 EIP 寄存 
癸 。 说 时 迟 ， 那 时 快 ， 内 核 束 开始 执行 了 。 


17.3.2 创建 中 断 摘 述 符 表 


现在 转 到 代码 清单 17-2， 这 是 内 核 程 序 的 代码 。 

当 内 核 开 始 执行 时 ， 执 行 点 位 于 第 872 行 。 此 时 ， 指 令 指 针 寄 存 器 
EIP 的 内 容 必 然 大 于 0x80040000， 因 为 内 核 程序 已 经 被 映射 到 虚拟 地 址 
空间 的 高 端 。 

接 下 来 的 工作 是 准备 保护 模式 下 的 中 断 系 统 。 保 护 模式 下 的 中 断 机 
制 不 同 于 实 模式 ， 因 此 ， 在 进入 保护 模式 之 前 ， 我 们 已 经 用 CLI 指令 关 挥 
了 外 部 硬件 中 断 ， 以 免 出 现 错误 。 而 且 ， 只 有 在 创建 了 中 断 描述 符 表 ， 
并 安装 了 中 断 处 理 程 序 之 后 ， 能 才 使 用 STI 指令 开放 便 件 中 断 ， 并 享受 中 
汤 的 好 处 。 

如 图 17-7 所 示 ， 我 们 把 中 断 描述 符 表 (IDT) 定义 在 物理 内 存 中 从 


地 址 0x0001F000 开始 的 地 方 ， 这 里 紧 换 着 内 核 的 页 目录 表 ， 是 一 段 没 有 
用 到 的 空间 。 要 知道 ， 目 前 是 在 分 页 模式 下 ， 低 端 1MB 内 存 已 经 被 映射 


到 高 端 ， 因 上 此， 中断 描述 符 表 的 线性 起 始 地 址 实际 上 是 0x8001F000。 访 
地 址 将 多 次 在 程序 中 引用 ， 为 了 方便 修改 ， 在 代 人 码 清单 的 第 9 行 ， 已 经 将 
它 声明 为 一 个 常数 idt_linear address， 以 后 可 以 直接 将 它 作 为 数值 使 
用 。 


币 数 定义 仅仅 在 程序 编 详 期 间 有 用 ， 在 编 详 之 后 不 占用 任何 地 址 空 
同 

表 的 线性 地 址 已 经 确定 ， 现 在 的 工作 是 在 其 中 安 疙 门 换 述 符 。 在 这 
里 ， 为 每 一 个 中 断 问 量 部 定义 独立 的 处 理 程序 不 太 现 实 ， 最 好 是 将 它们 
归 归 关 ， 比 如 将 使 件 中 断 归 为 一 闪 ， 再 将 开间 归 为 万 一 类， 如 此 一 来 ， 
只 需要 定义 两 个 通用 的 中 断 处 理 程序 即 可 。 如 条 有 示人 个 中 断 或 卉 帅 需 要 
特殊 处 理 ， 可 以 根据 需要 随时 安 妆 单独 的 程序 。 


异常 的 通用 处 理 程 序 是 在 标号 general exception handler 处 定义 
的 ， 位 于 第 422 行 ， 它 只 做 两 件 事 ， 先 显示 错误 信息 ， 然 后 集 机 。 在 屏 
各 上 显示 信息 依然 要 使 用 过 程 put_string， 在 平坦 模型 下 ， 调 用 该 过 程 不 
需要 使 用 远 转 移 指令 。 但 是 ， 访 过程 还 要 被 包 状 成 调用 1]， 以 方便 在 用 
己任 务 内 调用 。 通 过 调用 门 的 控制 转移 属于 远 过 程 调用 ， 因 此 ， 请 看 第 
59 行 ，put_string 过 程 是 用 retf 返回 的 。 


这 束 古 襄 ， 尺 官 过 程 put_string 十 内 核 的 家 人 ， 但 还 必须 用 远 过 程 调 
用 的 方式 使 用 : 


mov ebx,excep msg 


call flat 4gb code seg sel:put string 


我 们 只 为 内 核定 义 了 两 个 段 ，4GB 的 代码 段 和 4GB 的 数据 段 ， 为 了 
方便 引用 ， 在 代码 清单 17-2 的 第 7 行 和 第 8 行 ， 分 别 定 义 了 两 个 利 数 
flat 4gb code seg sel 和 flat 4gb data seg sel， 前 者 是 4GB 代码 段 
的 选择 子 ， 后 者 是 4GB 数据 段 的 选择 子 。 


对 异 第 的 处 理 很 复式 ， 要 分 具体 情况 。 有 的 开 帅 及 生 后 ， 只 要 纠正 
了 错误 ， 还 可 以 再 次 执行 产生 寞 第 的 指令 ， 比 如 页 故障 ; 有 的 弄 利 及 生 
后 ， 妆 前 任务 个 可 能 冉 恢 复 执 行 ， 有 有 的 弄 第 有 错误 代 公 压 栈 ， 而 有 的 则 
没有 。 前 两 种 情况 还 好 办 ， 如 来 你 愿意 ， 还 能 用 iretd 指令 返回 ; 但 是 对 
于 有 和 没有 和 错误 代 公 的 迟 况 ， 束 人 不 好 办 了 。 没 有 还 好 ， 可 以 耳 接 用 iretd 
返回 ; 如 末 有 ， 则 必须 先 弹 出 错误 代 人 码 。 在 一 个 通用 的 卉 第 处 理 程序 


中 ， 无 法 判断 有 没有 错误 代码 压 栈 ， 因 此 ， 唯 一 的 异 间 处 理 办 法 融 是 俘 
机 L。 

第 877 一 880 行 ， 调 用 make gate descriptor 过 程 创建 中 断 门 描述 
和 侍 。 该 过程 不 但 可 以 用 于 创建 调用 门 描述 符 ， 还 可 以 用 来 创建 中 断 门 、 
陷阱 门 和 任务 门 的 描述 符 。 在 此 处 ， 描 述 符 的 目标 代码 段 选 择 子 是 当前 
内 核 4GB 代码 段 选 择 子 ， 有 段 内 偏 移 量 是 通用 异常 处 理 过 程 的 线性 地 址 ， 
肯定 大 于 0x80040000; 摘 述 符 的 属性 值 为 0x8E00， 指 示 这 是 一 个 32 位 
的 中 断 门 摘 述 符 ， 门 的 特权 级 别 为 零 。 

一 般 来 说 ， 内 核 不 会 允许 3 特权 级 的 用 户 任 务 使 用 
make _gate descriptor 过 程 。 因 此 ， 它 可 以 定义 成 用 ret 指令 返回 的 近 过 
程 ， 而 不 是 现在 的 远 过 程 。 在 内 核 中 以 近 过 程 调用 的 方式 使 用 它 更 方 
便 ， 但 我 们 也 不 想 对 它 做 任何 改动 ， 毕 葛 它 一 直 是 用 retf 指令 返回 的 。 
此 ， 在 这 里 对 它 的 调用 还 是 远 调 用 。 

第 882 一 889 行 ， 在 IDT 中 安装 前 20 个 描述 符 ， 它 们 都 指向 通用 异 
常 处 理 程序 。EBX 寄存 器 指 癌 IDT 的 线性 基地 址 ; ESI 寄存 器 是 IDT 内 
的 索引 ， 或 者 说 是 中 断 问 量 号 。 每 个 摘 述 符 占 8 字 和 节 ， 因 此 ， 每 个 描述 符 
的 线性 地 址 是 EBX 十 ESIx8。 

第 892 一 903 行 ， 在 IDT 内 安装 通用 中 断 处 理 程 序 ， 中 断 问 量 20 一 
255， 对 应 着 Intel 保留 的 中 断 问 量 ， 以 及 外 部 人 硬件 中 断 。 通 用 的 中 断 处 理 
过 程 general_interrupt_handler 是 在 第 410 行 定 义 的 。 第 411 一 419 行 ， 
先是 同 8259A 已 片 发 送 中 断 结束 命令 EOI (End Of Interrupt) ， 然 后 的 
行 iretd 指令 从 中 断 返 回 。 很 明显 ， 通 用 的 中 断 处 理 过 程 什么 也 不 做 。 但 
是 ， 如 果 没 有 这 个 什么 也 不 做 的 过 程 ， 当 中 断 发 生 时 ， 就 会 出 问题 。 

根据 实际 需要 ， 中 断 或 开 剃 应当 单独 处 理 。 第 906 一 913 行 ， 在 IDT 
中 安装 0x70 号 中 断 的 处 理 过 程 。 这 上段 代码 很 好 理解 ， 首 先 用 
make_gate_descriptor 过 程 创 建 一 个 指 同 0x70 号 中 断 处 理 过 程 的 中 断 门 
描述 符 ， 然 后 ， 将 它 写 入 相应 的 IDT 表 项 内 。 该 表 项 的 线性 地 址 等 于 IDT 
的 线性 起 始 地 址 ， 加 上 0x70 乘 以 8。 


17.3.3 用 定时 中 断 实施 任务 切换 


刚才 安 冯 的 那个 0x70 号 中 断 处 理 过 程 ， 主 要 目的 是 进行 任务 切换 。 


我 们 知道 ， 计 算 机 主板 上 有 实时 时 钟 必 户 RTC， 可 以 定时 产生 更 新 
周期 结束 中 断 信 号 。 可 以 设置 RTC 心 片 ， 使 得 它 每 次 更 新 CMOS 中 的 时 
间 信 息 后 ， 便 友 出 这 个 中 断 信号 。 在 本 书 的 前 半 部 分 ， 刚 开始 引入 中 糊 
的 概念 时 ， 我 们 用 过 这 个 中 类 。 


RTC 心 请 的 中 断 线 和 8259A 从 卢 的 第 1 个 引 脚 相连 ， 一 般 情 况 下 ， 
该 引 脚 对 应 的 中 断 向 量 为 0xX70 。 因 此 ， 它 的 处 理 过 程 就 叫 
rtm_0x70_interrupt_handle， 位 于 代码 清单 17-2 的 第 429 行 。 


由 于 是 硬件 中 断 ， 因 此 ， 第 433 一 435 行 ， 先 要 向 8259A 芯片 发 送 中 
断 结束 命令 EOI， 人 否则 它 不 会 再 同 处 理 需 发 送 另 一 个 中 新 “通知 ”。 

说 实在 的 ， 用 实时 时 钟 的 更 新 周期 结束 中 断 来 实施 任务 切换 并 不 是 
一 个 好 主意 。 和 别 的 中 断 相 比 ， 它 更 哆 唆 ， 因 为 必须 读 一 下 CMOS 芯片 
内 的 寄存 器 C， 使 它 复 位 一 下 ， 才 能 使 RTC 产生 下 一 个 中 断 信 和 号。 全 
则 ， 它 只 产生 一 次 中 断 信 号 。 因 此 ， 第 437 一 439 行 束 用 来 做 这 个 工作 。 
如 果 对 此 不 熟悉 ， 建 议 回 到 本 书 的 前 面 复 习 一 下 。 


在 多 任务 系统 中 ， 同 时 有 很 多 任务 等 竺 调度 。 为 了 记 住 都 有 哪些 任 
务 ， 我 们 使 用 了 任务 控制 块 (CTCB) ， 并 把 它们 穿 在 一 起 ， 形 成 TCB 
链 ， 链 上 的 每 一 个 TCB 称 为 节点 。 在 上 一 章 里 ， 网 16-25 给 出 了 TCB 的 
基本 结构 。 在 这 一 章 里 ， 我 们 继续 使 用 这 个 版 本 的 TCB。 


学 过 数据 结构 的 人 都 知 秆 ， 链 才 用 得 很 广泛 ， 而 它 也 拥有 一 套 完 你 
的 算法 ， 用 来 添加 贡 点 、 插 入 布 后 、 删 除 节 氮 和 过 历 整 个 链表 。 很 宋 入 
地 ， 我 们 现在 终于 有 机 会 用 汇编 语言 实现 这 些 算 法 了 。 


在 我 们 这 个 链表 中 ， 有 一 个 链表 头 ， 指 同 第 一 个 TCB 的 线性 基地 
址 。 然 后 ， 在 每 个 TCB 内 偏 移 量 为 0x00 处 ， 是 下 一 个 TCB 的 线性 地 
址 。 当 此 处 为 0 时 ， 说 明 这 是 链 上 最 后 一 个 TCB。 第 517 行 ， 声 明了 标 妃 
tcb_chain， 并 初始 化 了 一 个 双 字 ， 这 惑 是 链表 头 。 如 图 17-9 所 示 ， 链表 
头 有 自己 的 线性 地 址 ， 比如 0x8005320 。 它 是 一 个 双 字 ， 内 容 是 
0x80006000 ， 这 束 是 链 上 第 一 个 TCB (TCB1) 的 线性 地 址 。 


在 线性 地 址 0x80006000 处 ， 是 TCB2， 其 内 部 偏 移 量 为 0x04 的 地 
方 ， 古 当前 任务 的 状态 ， 这 是 一 个 字 ， 石 其 值 为 0x0000， 表 示 这 是 一 个 
空 用 的 任务 ， 或 者 一 个 挂 起 的 任务 ， 夺 其 值 为 0xXFFFF， 则 表明 这 是 当前 
正在 运行 中 的 任务 (当前 任务 ， 或 者 忙 任务 ) 。 在 任务 时 候 ， 链 表 中 只 
TT ME 


TCB, 内 ， 偏 移 为 0x00 

信 是 下 一 2 了 TCB 则 TCB， 
的 线性 地 址 。 于 是 ， 我 们 可 以 

rs， 根据 0x80009000 这 个 值 ， 定 
位 到 TCB, 。 很 显然 ， 这 是 一 

个 正在 运行 中 的 任务 ， 状 态 为 
忙 ， 下 一 个 TCB， 即 TCB, 的 
线性 地 址 是 0x80001C00 。 再 

Tc， 来 看 TCB3， 它 的 状态 为 挂 起 
或 者 空间， 而 且 内 部 偏 移 为 
0x00 的 地 方 是 0， 它 就 是 链 上 


8001C000 


80009000 





80006000 


最 后 一 个 TCB。 
， 在 中 断 内 实施 任务 切换 ， 
了 IC， 可 以 使 用 jmp 指令 ， 从 当前 正 
本 在 运行 的 任务 切换 到 另 一 个 空 


亲 任 务 。 中 断 的 及 生 征 随机 
的 ， 但 是 ， 可 以 肯定 的 是 ， 当 


本 一 tcb chain 中 汤 发 生 时 》 必 定 有 一 个 任务 


80005320 正在 运行 中 。 因 此 ， 中 断 总 是 
| | 在 某 个 任务 内 发 生 的 。 

图 17-9 TCB 链表 示意 图 如 图 17-10 所 示 ， 当 中 断 

发 生 时 ， 任 务 可 能 正在 局 部 空 

间 执 行 ， 也 可 能 正在 全 局 空间 内 执行 ， 即 在 内 核 中 执行 ， 毕 况 内 核 被 映 


射 到 每 个 任务 地 址 空 上 国 的 局 2GB。 无 论 征 在 任务 的 局 部 空间 执行 ， 还 征 
在 全 局 空间 执行 ， 当 中 上 断 及 生 时 ， 因 为 中 断 处 理 过 程 位 于 内 核 中 ， 因 
此 ， 控 制 部 会 转移 到 任务 的 全 局 空间 ， 去 执行 当前 的 中 断 处 理 过 程 


rtm Ox7/0 interrupt handle。 


所 有 任务 都 共用 同一 个 全 局 空间 ， 因 此 ， 中 断 处 理 过 程 
rtm_0x70_interrupt_handle 也 只 有 一 份 。 尽 管 如 此 ， 当 有 个 任务 成 为 正 
在 执行 的 当前 任务 时 ， 它 便 拥 有 了 该 中 断 处 理 过 程 。 每 个 任务 在 执行 该 
过 程 时 都 有 上 自己 独立 的 机 需 状 态 和 寄存 需 状 态 ， 并 使 用 目 己 私有 的 0 特权 
级 栈 段 。 所 以 ， 这 里 面 不 存在 任何 冲突 和 混乱 的 情况 。 


在 图 17-10 中 ， 我 们 是 假定 中 断 肥 生 在 任务 的 局 部 空间 。 也 束 定 说 ， 
任务 正在 目 己 的 局 部 空间 内 执行 。 此 时 ， 将 转 到 全 局 空间 内 执行 内 核 的 
中 断 处 理 过 程 。 


任务 


EE 
要 ay 
mn 
me 
ed 


4: 执行 iretd 指 令 ， 从 中 断 返 回 1: 发 生 中 断 ， 中 断 处 理 


A 2: 使 用 jmp 指 令 发 起 的 任 

加 有 务 切 换 ， 切换 到 其 他 任务 

Sp 二 3: 其 他 任务 发 生 中 断 ， 
又 切换 到 本 任务 


此 虚线 框 表示 
中 断 处 理 过 程 


Bs 





图 17-10 ”利用 便 件 中 断 实 施 任务 切换 的 全 过 程 
中 断 处 理 过 程 的 主要 功能 是 确定 下 一 个 应 该 家 执行 的 任务 ， 并 切换 
到 那个 任务 。 整 个 过 程 如 下 : 


(D 遍历 TCB 链 ， 找 到 当前 任务 ， 也 就 是 寻找 那个 状态 值 为 0xFFFF 
的 节 点 。 如 果 找 不 到 ， 或 者 链表 为 空 ， 则 直接 转 到 步 又 (6)。 


@ 如 末 找 到 了 ， 则 将 此 节点 移 到 链表 的 末 病 ， 使 其 成 为 最 后 一 个 节 
氮 。 因 为 该 任务 刚刚 执行 冠 ， 所 以 ， 将 它 移 到 链 尾 ， 可 以 使 其 家 调度 的 
优先 级 别 最 低 。 


(3) 再 次 衣 历 TCB 链 ， 寻 找 链 上 第 一 个 状态 为 空 用 的 任务 ， 也 就 是 寻 
找 状态 值 为 0x0000 的 节点 。 如 果 找 不 到 ， 则 下 接 转 到 步 台 @)。 


(4) 如 果 找 到 了 ， 将 当前 任务 的 状态 置 为 0x0000， 将 找到 的 空闲 任务 
的 状态 置 为 OxFFFF。 


(9 使 用 mp 指令 从 当前 任务 切换 到 空闲 任务 。 
(6) 执行 iretd 指令 ， 中 断 返 回 。 


接着 看 图 17-10， 一 旦 找到 了 当前 为 低 的 任务 ， 以 及 那个 空闲 任务 ， 
则 控 图 中 所 示 ， 使 用 jmp 指 令 友 起 任务 切换 ， 切 换 到 空 用 任务 。 因 为 用 的 


是 jmp 指令 ， 故 当前 任务 的 TSS 摘 述 符 的 B 位 变 成 “0”， 而 新 任务 TSS 摘 
述 从 的 B 位 变 成 “1”"， 妆 前 任务 和 新任 务 之 间 古 非 铭 套 的 。 

男 外 ， 非 党 明显 的 是 ， 当 中 断 肥 生 ， 控 制 转移 到 其 他 任务 的 时 候 ， 
当前 《 旧 ) 任务 的 状态 是 停留 在 中 断 处 理 过 程 中 的 ， 该 任务 的 TSS 可 以 
保存 这 一 状态 。 当 下 一 次 从 其 他 任务 切换 到 这 个 任务 后 ， 将 继续 执行 未 
完成 的 中 断 处 理 过 程 ， 并 在 过 程 的 最 后 执行 iretd 指令 ， 于 是 返回 到 当初 
发 生 中 断 的 地 方 继 续 执 行 。 在 图 17-10 中 ， 是 返回 到 任务 的 局 部 空间 执 
行 ， 

注意 ， 其 他 任务 的 执行 情况 也 和 图 17-10 中 的 这 个 任务 相同 。 


一 旦 明白 了 我 们 要 做 什么 ， 以 及 如 何 做 ， 现在， 来 看 看 这 个 过 程 具 
体 是 怎么 实现 的 。 首 先是 在 链表 中 找到 当前 任务 ， 也 就 是 那个 状态 为 忙 
(0xFFFF》 的 广 点 (Node) ， 这 是 代码 清单 17-2 第 442 一 450 行 的 功 
能 。 

第 442 行 ， 先 把 链表 头 tcb_chain 的 线性 地 址 传送 到 EAX 寄存 器 ; 第 
444 行 ， 因 为 链表 头 的 内 容 是 第 一 个 TCB 的 线性 地 址 ， 因 此 ，EBX 寄存 
右 的 内 容 驶 是 第 一 个 TCB 的 线性 地 址 ， 如 图 17-11 〈a) 所 示 。 

第 445、446 行 ， 判 断 EBX 寄存 器 的 内 容 是 人 否 为 0。 也 惑 是 说 ， 链 表 
是 否 为 衬 。 如 果 是 仪 有 一 个 链表 头 的 空 表 ， 束 直 接 转 移 标 号 .irtn 处 ， 那 
里 是 一 个 从 中 断 返 回 的 iretd 指令 。 人 否则 ， 说 明 链 表 不 空 ， 于 是 EBX 寄存 
右 的 内 容 驶 是 第 一 个 TCB 的 线性 地 址 ， 如 图 17-11 (b〉 所 示 。 
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(c) 
图 17-11 链表 裔 历 过 程 中 的 当前 节 点 


第 447、448 行 ， 判 断 链 上 第 一 个 TCB 是 否 为 当前 正在 执行 的 任 
务 。 即 ，TCB 内 的 状态 域 是 否 为 0xFFFF。 如 果 不 是 ， 那 么 ， 将 EBX 寄 
存 器 的 内 容 传 送 到 EAX， 即 ， 令 EAX 寄存 器 指向 第 一 个 TCB 的 线性 地 
址 ， 回 到 前 面 ， 重 复 执行 第 444 一 450 行 的 指令 ， 顺 着 链表 继续 往 后 查 
找 。 


如 图 17-11《〈c) 所 示 ， 无 论 在 哪 种 情况 下 ，EAX 寄存 器 总 是 指 问 当 
前 节点 〈 包 括 头 节点 tcb_chain) ， 而 EBX 寄存 器 总 是 指向 下 一 个 节点 。 
要 是 能 够 在 链表 中 找到 一 个 状态 值 为 0OxFFFF 〈 忙 ) 的 节点 ， 那 么 ， 它 必 
然 是 当前 节点 的 下 一 个 节点 。 也 就 是 说 ，EAX 富 存 右 指 问 当 前 节点 ， 
EBX 寄存 器 指向 那个 状态 值 为 OxFFFF 的 节点 。 注 意 ， 这 里 的 “当前 节点 ” 
包括 头 节点 tcb chain 在 内 。 


另 一 个 值得 回味 的 事情 是 ， 由 于 是 在 平坦 模型 下 ， 链 表 头 tcb_chain 
和 其 他 节点 现在 都 位 于 同一 个 4GB 段 内 ， 所 以 才 有 了 这 段 比较 “流畅 ” 
“ 目 然 和 “统一 ”的 处 理 过 程 。 要 是 在 以 前 ， 头 市 点 tcb_chain 位 于 一 个 较 


小 的 内 核 数 据 段 ， 其 他 市 点 则 在 可 用 的 物理 内 存 中 ， 或 者 任务 的 虚拟 地 
址 空间 内 动态 创建 ， 由 于 它们 不 在 一 个 段 内 ， 无 法 用 同一 段 代 人 码 进 行 处 
Fhe 


只 有 在 找到 一 个 状态 值 为 0xFFFF 的 节点 时 ， 处 理 器 的 执行 流程 才 会 
到 达标 写 .b1 处 。 此 处 的 任务 是 将 该 季 氮 移 到 链表 的 来 妆 ， 使 它 能 够 仆 再 
次 调度 执行 的 可 能 性 降 到 最 低 ， 毕 苋 它 刚刚 执行 过 。 


为 此 ， 第 454、455 行 ， 先 将 那个 状态 为 忙 的 节点 从 链表 中 拆除 。 如 
图 17-12 所 示 ， 该 节点 是 当前 节点 的 下 一 个 节点 ， 即 节点 A， 其 线性 地 址 
在 EBX 寄存 器 中 ， 故 第 454 行 可 以 取得 该 节点 的 下 一 个 节点 ， 即 节点 B 
的 线性 地 址 。 然 后 ， 第 455 行 ， 把 节点 B 的 线性 地 址 填写 到 当前 节点 的 
“下 一 个 TCB 线性 地 址 ? 域 中 。 


当前 节点 节点 A 节点 B 





EAX=0x860606F80809 


EBX= [EAX] =6x86663666 
| ECX=[EBX]=8x86866666 
pd em 


图 17-12 ”将 状态 为 忙 的 市 点 从 链 上 拆除 


作为 一 个 特别 的 例子 ， 如 图 17-13 所 示 ， 如 来 链 上 只 有 一 个 TCB， 而 
且 十 个 状态 值 为 0xFFFF 的 节操 ， 那 么 ， 当 前 的 算法 也 同样 适用 。 在 这 种 
情况 下 ， 链 表 尖 将 失去 和 这 个 唯一 的 节操 的 联系 。 不 过 ， 这 只 是 暂时 
的 。 接 看 往 下 看 ， 我 们 要 将 那个 被 拆除 的 布点 挂 到 链表 的 末 闹 。 


QXFEEF 4 


tal Chain 
一 0x00000000 
0x00000000 0 


Ox80001000w 


E AX= t 和 bc a oy 4 aeeeee 


EBX=[ EAX] =6x86661666 
ECX=[ EBX] =6 


图 17-13 ”从 链 上 拆 际 节操 的 算法 适用 于 只 有 一 个 TCB 的 情况 





第 458 一 462 行 ， 从 当前 节点 开始 ， 继 续 往 后 遇 历 链表 ， 直 到 链表 结 
束 。 当 前 节点 的 线性 地 址 总 是 在 EAX 寄存 器 中 ， 而 EDX 寄存 器 的 内 容 总 
是 下 一 个 节点 的 线性 地 址 。 这 段 代码 将 反复 执行 ， 每 次 都 把 下 一 个 节 扣 
作为 当前 节点 来 处 理 ， 吏 这样， 最 终 会 定位 到 链 上 最 后 一 个 节点 。 

如 图 17-14 所 示 ， 当 执行 流程 到 达标 号 .b3 处 时 ，EAX 寄存 需 指 同 链 
上 最 后 一 个 节点 ， 其 内 容 为 该 节点 的 线性 地 址 ，EBX 寄存 器 在 这 段 代 码 
中 没有 使 用 ， 故 它 还 指 癌 那个 状态 值 为 OxFFFF 的 任务 ; EDX 寄存 器 的 
内 容 始 终 指 问 当前 节点 的 下 一 个 节点 ， 人 授 历 到 链表 末端 时 ， 其 内 容 为 0。 
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图 17-14 ”遍历 链表 ， 直 到 最 后 一 个 节点 


第 465、466 行 ， 将 状态 值 为 OxFFFF 的 节点 挂 到 链表 的 末端 ， 同 
上 时， 将 它 的 “下 一 个 TCB 线性 地 址 ” 域 改 为 0， 表 明 这 是 最 后 一 个 节点 ， 如 
图 17-15 所 示 。 
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图 17-15 ”将 状态 为 忙 的 任务 挂 在 链表 的 末 新 


对 于 前 面 那 个 特别 的 例子 来 说 ， 即 使 链 上 只 有 一 个 TCB， 将 它 从 链 
中 拆除 ， 并 移 到 链 尾 的 过 程 也 同样 适用 。 如 图 17-16 所 示 ， 当 那个 唯一 
的、 状态 值 为 0xFFFF 的 节点 从 链 中 拆除 后 ， 链 表 头 tcb_chain 中 的 内 容 
为 0。 当 执行 过 历 动作 时 ， 它 会 被 当成 链 上 最 后 一 个 节点 对 符 。 在 这 种 情 
况 下 ， 了 最 终 的 结果 是 又 重新 将 那个 被 拆除 的 币 点 挂 在 链表 上 上， 前 后 的 结 
果 一 样 ， 来 回 一 样 远 。 

第 469 一 475 行 ， 从 头 开 始 壳 历 链 表 ， 直 到 发 现 第 一 个 状态 值 为 
0x0000“〈 衬 闲 ) 的 节点 。 这 段 代 人 码 没什么 好 说 的 ， 方 法 和 前 面 一 样 。 如 
果 没 有 找到 ， 就 转 到 标号 .irtn 处 ， 直 接 从 中 断 返 回 。 原 因 是 ， 如 果 没 有 
状态 为 空 几 的 任务 ， 任 务 切 换 束 没 办 法 进行 。 这 种 可 能 性 是 有 有 的 ， 比 
如 ， 在 内 核 刚 刚 加 载 ， 并 做 为 第 一 个 状态 为 忙 的 任务 添加 到 链表 中 的 时 
候 。 这 时 ， 链 表 中 只 有 一 个 TCB， 而 且 节 点 的 状态 值 为 0xFFFF。 

不 过 ， 一 旦 发 现 有 空闲 的 任务 ， 那 么 此 时 EAX 寄存 器 指 癌 这 个 状态 
值 为 0x0000 (空闲 ) 的 节点 ，EBX 寄存 器 指向 那个 状态 值 为 
0xFFFF〈 忙 ) 的 节点 。 第 478、479 行 ， 分 别 用 not 指令 将 它们 的 状态 值 
取 反 。 也 束 是 说 ， 原 先 为 空 用 的 任务 变 忙 ， 原 先 为 忙 的 任务 变 为 空闲 。 

在 每 个 TCB 内 偏 移 量 为 0x14 的 地 方 ， 依 次 是 该 任务 TSS 的 线性 地 
址 和 TSS 摘 述 符 选 择 子 。 第 450 行 ， 使 用 间接 远 转 移 指令 jmp 发 起 任务 
切换 ， 控 制 转移 到 被 选中 的 那个 新 任务 。 


等 下 一 次 当前 任务 义 煞 得 执行 权时 ， 返 回 点 是 第 483 行 。 于 是 ， 执 
行 iretd 指令 ， 从 中 断 返 回 ， 正 常 执 行 任务 的 其 他 代码， 下 到 下 一 个 实时 
时 钟 中 断 肥 生 。 
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图 17-16 将 节点 移 到 和 链 尾 的 特别 例子 
17.3.4 8259A 芯片 的 初始 化 


看 起 来 ， 和 所 有 中 断 / 弄 音 相 关 的 门 摘 述 符 都 已 经 安 友 好 了 ， 现 在 ， 
应 该 把 中 断 拉 述 符 表 的 基地 址 和 界限 值 加 载 到 中 断 摘 述 符 表 寄存 堪 
CIDTR) 中 。 


第 916 行 ， 将 中 断 描述 符 表 的 界限 值 写 入 标号 pidt 处 的 字 单 元 。pidt 
是 在 第 513 行 声明 的 ， 初 始 化 了 6 字 节 ， 其 中 ， 前 面 的 字 是 IDT 的 界限 
值 ， 等 于 描述 符 的 个 数 〈255) 乘 以 8 减 去 1; 后 一 个 双 字 保存 的 则 是 IDT 
的 线性 基地 址 。!IDT 的 基地 址 已 经 定义 为 常量 idt_linear_ address， 
此 ， 第 917 行 ， 将 这 个 数值 写 入 该 双 字 单元 中 。 

第 918 行 ， 用 lidt 指令 加 载 IDTR 寄存 器 (Load Interrupt Descriptor 
Table Register) 。 访 指令 的 格式 和 lgdt 相同 : 


lidt m48 :lidt ml16&m32 


这 了 吏 是 说 ， 访 指令 的 操作 数 是 一 个 内 存 地 址 ， 指 同一 个 包含 了 48 位 
(6 字 节 ) 数据 的 内 存 区 域 。 在 16 位 模式 下 ， 该 地 址 是 16 位 的 ;在 32 
位 模式 下 ， 该 地 址 是 32 位 的 。 和 lgdt 指令 一 样 ， 该 指令 在 实 模式 下 也 可 
以 执行 ， 以 便于 在 进入 保护 模式 之 前 束 做 好 有 中 断 有 关 的 准备 工作 。 

在 这 6 字 节 的 内 存 区 域 中 ， 前 16 位 是 IDT 的 界限 值 ， 高 32 位 是 IDT 
的 线性 基地 址 。 在 初始 状态 下 《计算 机 局 动 之 后 ) ，GDTR 的 基地 址 被 
初始 化 为 0x00000000; 界限 值 为 0xFFFF。 


该 指 癌 不 影响 任何 标志 位 。 


一 旦 设置 了 中 断 描述 符 表 〈IDT) ， 并 加 载 了 IDTR 寄存 器 ， 处 理 器 
的 中 断 机 制 就 开始 起 作用 了 。 比 如 ， 要 是 有 异常 发 生 ， 就 会 调用 相应 的 
异常 人 处理 过 程 。 如 果 EFLAGS 寄存 磊 的 IF 位 处 于 置 位 状态 ， 硬 件 中 上 断 也 
能 得 到 相应 的 处 理 。 不 过 ， 依 目前 的 状态 ， 还 不 宜 开 放 硬 件 中 晰 。 


在 保护 模式 下 ， 如 果 计 算 机 系统 的 可 编程 中 断 控制 器 芯片 还 是 
8259A， 那 就 得 重新 进行 初始 化 。 事 实 上 ，8259A 并 没有 过 时 ， 在 单 处 
理 器 系统 中 ， 它 依然 健在 。 


重新 初始 化 8259A 沪 片 的 原因 是 其 主 片 的 中 断 问 量 和 处 理 器 的 异常 
品 量 冲 突 。 计 算 机 启动 之 后 ， 主 片 的 中 断 癌 量 为 0x08~~0x0F; 从 片 的 中 
断 问 量 是 0x70 一 0x77， 在 以 8086 为 处 理 器 的 系统 中 ， 这 没有 什么 问题 ， 
在 32 位 处 理 器 上 ，0x08 一 0x0OF 已 经 被 处 理 器 用 做 异常 向 量 。 


好 在 8259A【〈 以 及 VO APIC) 都 是 可 编程 的 ， 人 允许 重新 设置 中 断 问 
量 。 根 据 Intel 公司 的 建议 ， 中 断 问 量 0x20 一 0xFF 〈32 一 255) 是 用 户 可 
以 目 由 分 配 的 部 分 。 那 么 ， 我 们 可 以 设置 8259A 的 主 片 ， 把 它 的 中 断 问 
量 改 成 0xX20~~0x27， 这 样 就 没 问题 了 。 

对 8259A 编程 需要 使 用 初始 化 命令 字 (nitialize Command Word， 
ICW) ， 以 设置 它 的 工作 方式 ， 共 有 4 个 初始 化 命令 字 ， 分 别 是 ICW1 一 
ICW4， 都 是 单字 节 人 命令。ICW1 用 于 设置 中 断 请 求 的 触发 方式 ， 以 及 级 
联 的 芯片 数量 ，ICW2 用 于 设置 每 个 必 瞩 的 中 断 问 量 ; ICW3 用 于 指定 用 
哪个 引 脚 实现 蕊 片 的 级 联 ，ICW4 用 于 控制 芯片 的 工作 方式 。 


对 8259A 忆捷 的 编程 不 是 本 书 的 重点 ， 因 为 这 涉及 它 的 内 部 构造 和 
工作 原理 ， 说 来 话 长 。 同 时 ， 这 还 是 一 个 令 人 厌恶 的 芯片 ， 只 分 配 了 两 
个 端口 ， 设 置 起 来 拐 讨 抹 角 ， 很 畴 烦 。 不 像 有 些 心 片 ， 每 个 端口 对 应 着 


主 厂 的 问 口 号 是 0x20 和 0x21， 从 所 的 奖 口 号 是 0XAO0 和 0xA1， 要 及 
送 初 始 化 命令 字 给 8259A 羽 片 ， 对 于 主 卢 来 说 ， 需 要 先 癌 0x20 端口 发 送 
ICW1， 而 对 于 从 片 来 说 ， 这 个 端口 是 0xXA0。 这 是 一 个 标志 ， 每 次 8259A 
心 片 接 到 ICW1 时 ， 都 意味 着 一 个 新 的 初始 化 过 程 开 始 了 。 


从 0x20/0xA0 端口 接受 命令 字 ICW1 后 ，8259A 芯 所 期待 从 
0x21/0xA1 端口 接受 命令 字 ICW2。 但 是 ， 它 是 否 期 待 ICW3 和 ICW4， 还 
要 看 ICW1 的 内 容 。 如 图 17-17 所 示 ，ICW1 的 位 0 决定 了 是 否 有 ICW4 命 
令 ， 位 1 指示 是 否 为 多 片 级 联 。 如 果 是 多 片 级 联 ， 那 么 ， 必 定 有 ICW3 命 
令 。 这 样 一 来 ，8259A 必 片 就 知道 ， 在 接受 了 ICW2 命令 之 后 ， 是 否 还 
要 在 相同 的 端口 (0x21/0xA1) 上 依次 再 接受 ICW3 和 |ICW4。 

注意 ， 在 图 17-17 中 ， 深 色 的 比特 位 表示 它 已 被 保留 ， 或 者 不 用 ， 使 
用 图 中 所 标注 的 固定 值 (0 或 1) ; 有些 比特 虽然 不 是 深 色 ， 但 也 标注 了 
固定 值 (0 或 1) ， 这 些 位 是 有 意义 的 ， 可 以 设置 或 改变 ， 有 具体 的 含义 可 
参考 芯片 手 册 。 但 是 ， 之 所 以 在 这 里 采用 固定 值 ， 是 因为 束 目 前 的 应 用 
环境 来 说 ， 这 是 比较 通用 的 合理 设置 。 

来 看 代码 清单 17-2。 

第 921、922 行 ， 先 向 8259A 主 片 发送 ICW1， 端 口号 是 0x20。 从 命 
令 上 看 ， 这 里 需要 ICW4， 而 且 指定 了 多 必 片 级 联 方式 ， 中 断 信号 的 采集 
用 的 是 边沿 触发 方式 。 因 为 是 多 芯片 级 联 ， 故 需要 ICW3。 

第 923、924 行 ， 通 过 另 一 个 端口 0x21 向 主 片 发 送 ICW2 命令 。 如 图 
17-17 所 示 ，ICW2 命令 用 于 设置 芯片 的 中 断 问 量 号 。 忆 片 每 个 引 脚 的 中 
汤 问 量 号 不 需要 单独 设置 ， 只 需要 一 个 起 始 同 量 写 即 可 。1ICW2 的 低 3 位 
不 用 ， 固 定 为 0， 仅 高 5 位 有 效 。 在 这 里 ，ICW2 的 值 是 0x20， 对 应 着 二 
进 制 数 00100000， 高 5 位 是 00100。 此 时 ， 该 芯片 的 8 个 中 断 引 脚 就 分 
别 对 应 着 中 断 问 量 号 0Xx20 一 0x27 。 


再 举 个 例子 ， 如 果 ICW2 的 高 5 位 是 01101， 那 么 ， 加 上 低 3 位 的 全 
“0"”， 它 对 应 的 二 进 制 数 就 是 01101000， 即 0x68， 该 芯片 的 中 断 向 量 为 
0x68 一 0x6F。 

第 925、926 行 ， 依 然 通过 端口 0x21 向 主 片 发 送 ICW3 命令 。 如 图 
17-17 所 示 ， 发 送 给 主 片 的 命令 和 发 送 给 从 片 的 命令 ， 是 不 相同 的 。 因 为 
这 里 是 在 设置 主 片 ， 故 该 命令 字 的 7 比特 分 别 表 示 那 个 引 脚 是 否 连 着 从 
片 。 从 命令 字 上 看 ， 是 0x04， 即 二 进 制 的 00000100， 也 就 是 说 ， 该 蕊 片 
的 第 3 个 引 脚 连 看 从 搬 。 


第 927、928 行 ， 依 然 通过 端口 0x21 向 主 片 发 送 ICW4 命令 。 如 图 
17-17 所 示 ， 我 们 发 送 的 命令 字 是 0x01， 这 表示 要 求 采 用 非 自 动 结束 方 
式 。 对 于 单 族 使 用 的 场合 ， 采 用 目 动 结束 方式 较为 方便 ， 但 多 上 级 联 的 
ji vy 当 及 用 非 目 动 吉 束 方式 。 


"ICW4 一 一 为 “0” 表 示 本 次 初始 化 不 需要 发 送 ICW4 命 令 ; 为 “1” 表 示 必 须发 送 。 
。SNGL 一 一 为 “0” 表 示 系 统 中 有 多 个 级 联 在 一 起 的 8259A 芯 片 ; 为 “1” 表 示 单 片 使 用 。 
"LTIM 一 一 为 “0” 表 示 芯 片 是 边沿 触发 的 ; 为 “1” 表 示 电 平 触 发 。 


ICW2 





。 通 过 对 高 $ 位 〈T7 一 T3) 进行 设置 ， 以 改变 该 芯片 起 始 的 中 断 向 量 。 比 如 ， 当 ICW-2 为 
0x20 时 ， 该 芯片 的 8 个 引 脚 分 别 对 应 着 中 断 问 量 0x20 一 0x27。 


ICW3 





。 对 主 片 发 送 时 ，S7 一 S0 对 应 着 芯片 的 8 个 引 脚 。 某 引 脚 为 了 “1” 时 ， 表 示 有 从 片 和 它 相 连 。 
。 对 从 片 发 送 时 ，S7 一 S3 无 效 ，S2 一 S0 组 成 一 个 3 位 二 进 制 数 ， 表 示 从 片 连 至 主 片 的 哪个 引 脚 。 


7 0 


" AEOI 一 一 为 “0” 时 ， 表 示 非 上 自动 结束 方式 ， 要 求 在 中 断 处 理 过 程 中 明确 地 加 8259A 芯 片 写 中 
断 结束 命令 EOI;， 为 “1” 时 ， 表 示 上 自动 结束 方式 。 一 般 只 在 多 芯片 级 联 的 时 候 才 使 用 非 自 动 
结束 方式 。 


图 17-17 ”8259A 芯片 的 初始 化 命令 字 


第 930 一 937 行 ， 这 些 代 码 用 于 设置 和 主 片 相连 的 从 片 ， 方 法 大 致 相 
后， 读者 目 行 分 析 。 


第 940 一 952 行 ， 这 段 代 码 专门 用 于 设置 和 0x70 号 时 钟 中 断 有 关 的 
硬件 状态 ， 包 括 RTC 和 8259A。 对 RTC 的 设置 包括 允许 它 产生 哪些 中 断 
信号 ， 并 读 一 下 它 的 寄存 器 C。 寄 存 器 C 在 每 次 读 取 后 自动 清 零 ， 如 果 没 
有 清 零 ，RTC 将 不 会 产生 中 断 信 号 ; 对 8259A 的 设置 主要 是 打通 它 和 
RTC 之 间 的 中 断 信号 通路 。 这 段 代 码 是 从 第 9 章 原 封 不 动 地 抄 来 的 ， 在 
那 一 章 里 已 经 做 过 讲解 ， 这 里 不 再 歼 述 


第 954 行 ， 用 sti 指令 设置 EFLAGS 寄存 器 的 IF 位 ， 开 放 硬 件 中 断 。 


中 断 是 计算 机 系统 中 一 个 必 不 可 少 的 恶魔 ， 不 用 它 便 妆 ， 一 旦 放出 
本 它 ， 束 好 比 打 开 了 潘多拉 麻 合 。 从 此 之 后 ， 如 果 你 处 理 不 当 ， 各 种 奇 
怪 的 程序 问题 都 有 可 能 出 现 ， 而 且 神 出 鬼 没 ， 不 容易 找到 它 友 生 的 根 
源 。 


这 是 可 以 理解 的 。 在 一 个 顺 友 工作 的 程序 中 ， 很 容易 用 调试 工具 找 
到 错误 指令 和 出 错 原因 。 但 是 ， 中 断 是 随机 发 生 的 ， 而 且 不 能 确定 在 中 
汤 发 生 时 ， 处 理 器 将 控制 转移 到 了 哪里 。 即 使 知道 出 错 的 位 置 ， 也 不 容 
易 友 现 错 误 的 原因 。 很 多 时 候 ， 中 断 人 处理 过 程 和 被 中 断 的 程序 有 着 人 逻辑 
上 的 关联 ， 包 括 状 态 的 依赖 和 数据 的 共享 和 争 用 ， 等 等 。 

说 这 些 就 扯 远 了 ， 还 是 看 看 现在 都 会 发 生 什 么 。 因 为 执行 了 sti， 便 
件 中 断 会 随时 得 到 处 理 。 特 别 是 我 们 最 关注 的 实时 时 钟 中 断 ， 它 差不多 
会 在 1 秒 钟 内 发 生 一 次 。 当 此 中 汤 发生 后 ， 过 程 
rtm_0x70_interrupt_handle 融会 钻 执 行 。 它 会 过 历 TCB 链 ， 找 到 一 个 状 
态 为 忙 的 任务 ， 和 一 个 状态 为 空 闻 的 任务 ， 然 后 发 起 任务 切换 。 

就 目前 的 实际 情况 而 言 ， 该 中 断 处 理 过 程 不 会 做 太 多 的 事 ， 仅 仅 是 
给 8259A 芯片 发 送 中 断 结束 命令 EOI， 并 读 一 下 RTC 芯片 的 寄存 器 C， 
然后 执行 iretd 指令 返回 ， 因 为 目前 链表 为 空 。 


17.3.5 “平坦 模型 下 的 字符 串 显 示例 程 


代码 清单 17-2 第 956、957 行 ， 在 屏 右 上 显示 宁 从 时 ， 表 示 内 核 正 
工作 在 你 护 和 分 页 和 模式 下 ， 凡 核 的 地 址 空间 已 经 航 有 映射 到 地 址 
0x80000000 以 上 。 


在 本 章 中 ， 由 于 使 用 了 平坦 模型 ，put_string 过 程 也 不 得 不 做 了 大 幅 
及 修改 ， 以 适应 这 种 变化 。 一 了 以来， 该 过程 接受 的 参数 是 DS:EBX。 此 
处 ，DS 是 数据 段 寄存 上 融 ， 要 显示 的 字 从 串 位 于 它 所 指 问 的 段 中 ; EBX 
寄存 邢 的 内 容 是 字符 串 在 段 内 的 俩 移 量 。 显 然 ， 老 版 本 的 put_string 过 程 
征 面 癌 多 段 模 玖 的 。 

相反 地 ， 访 过 程 的 新 版 本 只 能 工作 在 平坦 模 开 下 ， 它 只 需要 用 EBX 
寄存 器 传 入 字符 串 的 线性 地 址 即 可 。 在 平坦 模型 下 ， 字 符 串 位 于 任务 的 
4GB 虚拟 地 址 空间 内 ， 它 的 线性 地 址 是 唯一 的 。 


在 字符 串 的 显示 期 间 ， 需 要 临时 关闭 人 硬件 中 断 ， 即 ， 用 cli 指令 清 零 
EFLAGS 寄存 器 的 IF 人 位。 如 果 不 这 么 做 ， 那 么 ， 在 字符 串 显 示 期 间 ， 随 
时 会 被 中 断 。 如 果 切 换 到 另外 一 个 任务 ， 那 么 ， 两 个 任务 所 显示 的 内 容 
就 有 可 能 在 屏幕 上 交 蔡 出 现 。 当 然 ， 这 还 算 不 上 是 严重 的 问题 ， 更 严重 
的 是 写 光 标 寄存 器 ， 举 个 例子 ， 任 务 A 读 光 标 位 置 ， 并 在 屏幕 上 写 了 一 
修 字 符 。 当 它 正 准备 用 新 的 数值 与 光标 寄存 器 时 ， 中 上 断 有 发生， 任务 B 开 
始 执行 。 任 务 B 也 读 光 标 位 置 并 在 那里 写字 符 。 因 为 任务 A 实际 上 并 没 
有 完成 推进 光标 的 工作 ， 故 任务 B 的 字符 会 履 盖 任务 A 的 字符 。 这 种 情 
况 发 生 的 几率 较 低 ， 但 并 不 是 不 会 发 生 。 

因此 ， 第 42 行 ， 在 开始 最 示 字 符 串 之 前 ， 先 鞭 止 便 件 中 断 ; 第 54 
行 ， 只 有 在 整个 字符 串 完整 地 显示 完毕 之 后 ， 才 开放 人 硬件 中 汤 。 这 样 ， 
每 个 任务 的 字符 串 都 能 完整 地 显示 。 同 时 ， 因 为 本 例 程 中 有 sti 指令 ， 
此 ， 在 整个 中 断 系 统 没 有 初始 化 完成 之 前 ， 不 能 调用 。 


在 硬件 中 断 关 闭 期 间 ，put_string 过 程 实际 上 是 调用 另 一 个 近 过 程 
put_char 来 逐个 显示 字符 的 。put_char 过 程 是 从 第 62 行 开 始 的 。 


第 68 一 81 行 的 工作 是 取 当 前 光标 位 置 。 取 得 的 光标 位 置 数 值 位 于 BX 
寄存 器 中 ， 要 用 于 寻 址 显示 缓冲 区 。 因 为 访问 显示 缓冲 区 时 用 的 是 32 位 
寻 址 方式 ， 故 必须 使 用 EBX 寄存 器 。 第 81 行 ， 用 and 指令 清除 EBX 寄 
存 右 的 高 16 位 ， 仅 保留 低 16 位 (BX) 。 


第 101 行 ， 写 字符 到 显示 缓冲 区 。 显 示 缓 冲 区 的 线性 其 地址 是 
0x800B8000， 绥 冲 区 内 的 偏 移 量 是 由 EBX 寄存 古 所 供 的 ，0x800B8000 
是 32 位 立即 数 ， 故 必须 和 EBX 寄存 占 搭 配 ， 而 不 能 用 BX 寄存 上 右 。 还 
有 ， 之 所 以 显示 缓冲 区 的 线性 基地 址 是 0x800B8000， 是 因为 物理 内 存 的 
低 端 1MB 被 完整 地 映射 到 从 0x80000000 开始 的 高 端 。 因 此 ， 线 性 地 址 
0x800B8000 会 被 处 理 需 的 页 部 件 转换 成 物理 地 址 0x000B8000。 


同样 的 道理 ， 第 111 一 121 行 ， 在 做 屏 姑 上 涂 的 操作 时 ， 要 传达 的 内 
容 在 4GB 段 内 的 偏 移 量 为 0x800B80A0; 目标 位 置 在 4GB 段 内 的 偏 移 量 
为 0x800B8000。 


17.4 内核 任 务 的 创建 
17.4.1 创建 内 核 任 务 的 TCB 


加 到 第 960 一 986 行 ， 他 往常 一 样 ， 在 屏 徐 上 显示 处 理 占 的 品牌 信 
已 ， 没 有 什么 好 说 的 。 

第 989 一 1007 行 ， 在 全 局 摘 述 符 表 〈GDT) 中 安 痛 调用 门 ， 为 用 户 
任务 提供 系统 服务 。 然 后 ， 通 过 调用 门 在 屏幕 上 显示 信息 ， 以 测试 调用 
门 的 安装 是 否 正确 。 

下 面 的 工作 是 创建 内 核 任 务 ， 也 束 是 我 们 所 说 的 程序 管理 坪 任 务 。 
内 核 任务 需要 一 个 任务 控制 块 CTCB) ， 毕 竟 它 也 要 参与 任务 轮转 。 但 
是 ， 该 TCB 所 需 的 内 存 不 是 动态 分 配 的 ， 而 是 一 段 静 态 的 空间 ， 是 在 内 
核 程序 编号 的 时 候 傈 留 的 。 回 到 前 面 第 519 行 ， 在 那里 亏 明 了 标号 
core_tcb， 并 初始 化 了 32 个 为 零 的 双 字 。TCB 不 需要 这 么 多 空间 ， 但 多 
保留 一 些 也 没 坏处 。 


第 1010 行 ， 首 先 设置 内 核 任 务 的 状态 值 为 0xFFFF 〈( 忙 〉。 实 际 
上 上， 当前 正在 执行 的 就 是 内 核 ， 从 东 种 意义 上 来 说 束 是 内 核 任务 ， 只 不 
过 没有 办 理 将 其 TSS 摘 述 符 传送 到 任务 寄存 器 TR 的 手续 而 已 。 

内 核 占据 着 它 目 己 的 虚拟 内 存 空间 的 高 端 ， 同 时 也 映 冉 到 每 个 任务 
的 虚拟 内 存 空间 的 高 问 ， 具 体 的 起 始 位 置 是 线性 地 址 0x80000000。 从 这 
里 开始 ， 前 1MB (0x80000000~0x800FFFFF) 已 经 被 它 自 己 用 完了 ， 
实际 可 以 继续 分 配 的 空间 从 线性 地 址 0x80100000 开始 。 因 此 ， 第 1011 
行 ， 在 TCB 中 设置 这 个 可 以 分 配 的 起 始 地 址 。 


每 个 任务 都 可 以 有 自己 的 LDT， 如 果 没 有 也 不 要 紧 。 第 1013 行 ， 设 
置 内 核 任 务 的 LDT 的 初始 界限 值 。 就 本 章 来 看 ， 这 个 值 是 用 不 上 的 ， 
为 内 核 任 务 没 有 LDT。 

对 TCB 的 初始 化 基本 就 是 这 些 。 第 1015 行 ， 将 内 核 任务 的 TCB 追 
加 到 TCB 链表 中 ， 像 从 前 一 样 ， 在 TCB 链表 中 添加 新 的 TCB 需要 调用 过 
程 append to tcb link， 该 过 程 位 于 第 845 行 ， 在 本 章 已 经 做 了 修改 ， 
此 适合 在 平坦 模型 下 工作 。 


当 程 序 员 不 是 一 件 容 易 的 事 ， 需 要 考虑 的 东西 太 多 。 访 问 和 修改 
TCB 链 原 本 不 是 多 大 的 事情 ， 可 要 是 中 汤 迭 和 进来 ， 束 得 小 心 了。 要 知 
道 ，0x70 与 实 时 时 钟 中 断 随时 都 在 发 生 ， 那 个 中 断 处 理 过 程 也 在 不 停 地 
访问 同一 个 TCB 链表 。 如 有 果 处 理 不 当 ， 很 容易 出 现 问 题 。 请 考虑 一 下 ， 
过 程 append to tcb link 主要 完成 两 件 事 : 


Q) 遍历 链表 ， 找 到 最 后 一 个 TCB， 修 改 它 的 “下 一 个 TCB 线性 地 址 ” 
域 ， 使 它 指 同 新 的 TCB; 


@) 清空 新 TCB 的 “下 一 个 TCB 线性 地 址 ? 域 ， 表 明 它 是 最 后 一 个 
TCB。 


假如 现在 已 经 完成 了 步骤 1， 新 TCB 已 经 成 为 链表 的 最 后 一 个 节点 。 
但 是 ， 在 准备 执行 步骤 2 时 ，0x70 号 中 上 断 发 生 了 ， 访 中 断 处 理 过 程 过 历 
链表 。 可 想 而 知 ， 因 为 新 TCB 的 “下 一 个 TCB 线性 地 址 ? 工 还 没有 清 零 ， 
所 以 ， 中 断 处 理 过 程 将 无 法 找到 链 尾 ， 而 且 会 用 那个 非 堆 的 数 作 为 地 
址 ， 访 问 到 它 不 该 访问 的 区 域 ( 不 存在 的 下 一 个 TCB〉， 处 理 器 产生 寞 
党 ， 程 序 很 可 能 因此 册 演 了 ! 


因此 ， 在 过 程 append to tcb link 的 一 开始 ， 也 就 是 第 847 行 ， 先 
用 cli 指令 屏蔽 硬件 中 断 。 


和 老 版 本 相 比 ， 新 版 本 的 append to tcb link 过 程 显 然 很 简洁 ， 毕 
葛 它 工作 在 平坦 模型 下 。 退 历 链 表 找 到 最 后 一 个 TCB 的 代码 可 以 参考 过 
程 rtm_0x70 interrupt_ handle， 它 们 是 相同 的 ， 不 再 鳌 述 。 


找到 最 后 一 个 TCB 之 后 ， 第 861 行 ， 修 改 它 的 “下 一 个 TCB 的 线性 地 
址 ? 域 ， 使 其 内 容 为 新 TCB 的 线性 地 址 ; 第 862 行 ， 将 新 TCB 的 “下 一 个 
TCB 的 线性 地 址 ” 域 清 零 。 这 两 行 很 危险 ， 在 它们 中 间 很 容易 友 生 中 断 。 
而 一 旦 发 生 中 断 ， 麻 烦 就 来 了 。cli 和 sti 指令 不 必 放 在 该 过 程 的 首尾 ， 放 
到 这 两 条 指令 的 前 后 就 行 : 


C13 
mov [eax],ecx 
mov dword [ecx],0x00000000 ;当前 TCB 指针 域 清 零 


St1 


实际 上 ， 这 征 更 合理 的 做 法 。 记 住 ，CLI 指令 只 在 最 有 必要 的 时 候 使 
用 。 在 一 个 正 第 的 系统 中 ， 大 家 部 很 性 ， 虱 需要 马不停蹄 地 投入 运行 ， 
不 要 让 无 谓 的 中 断 屏 表 指 令 影响 到 每 个 程序 的 正 币 执 行 。 


17.4.2 ” 安 汇 编 技 术 


接 下 来 是 创建 内 核 任 务 的 TSS 。 对 于 一 个 任务 来 说 ， 任 务 状 态 段 
(TSS) 是 必 不 可 少 的 。 为 此 ， 需 要 在 内 核 的 虚拟 地 址 空间 内 分 配 内 
仓 。 


第 1018 行 的 作用 是 分 配 创建 TSS 所 需要 内 存 空间 : 
alloce core linear 


这 是 非常 奇怪 的 ， 因 为 ， 它 既 不 是 处 理 需 指令 ， 也 不 像 标 号 ， 拓 然 
还 能 单独 存在 。 事 实 上 ， 在 汇编 语言 里 ， 这 是 合法 的 ， 因 为 它 是 宏 。 

安 (Macro) 是 一 种 徐 化 汇编 语言 程序 编写 的 强大 手段 ， 绝 大 多 数 沪 
编 语 言 编 译 器 都 支持 宏 ， 因 此 ， 这 些 汇编 语言 称 为 宏 汇编 。 

宏 并 不 是 处 理 器 指令 ， 但 它 也 不 同 于 编译 器 提供 的 伪 指 令 ， 专 业 地 
说 ， 它 是 预 处 理 指 令 。 我 们 知道 ， 编 译 器 在 编译 源 程 序 时 ， 要 多 裔 扫 
摘 ， 每 次 都 完成 不 同 的 工作 ， 这 些 都 可 以 称 为 预 处 理 ， 最 后 才 开 始 将 语 
句 ] 翻 译 成 机 器 指令 。 要 想 说 明 宏 是 什么 ， 下 面 是 一 个 例子 : 


sdefine vrm(x) 0xb8000+x 


[bites 32| 
mowv or Een em 0 


以 上 ，%define 用 来 定义 单行 的 宏 ， 宏 的 名 字 叫 vrm， 市 有 一 个 参数 
X， 参 数 要 放 在 括号 中 。 如 条 有 多 个 参数， 参数 之 间 要 用 未 亏 分 开 。 在 安 
的 名 字 之 后 ， 要 有 空格 ， 一 个 或 者 多 个 空格 均 可 ， 然 后 ， 和 是 一 个 表达 
式 。 从 该 表达 式 可 以 看 出 这 个 宏 是 用 来 做 什么 的 ， 有 什么 意义。 


宏 的 作用 十 可 以 代 谷 复 末 的 表达 式 。 在 编 详 期 间 ， 编 详 带 要 先 将 宏 
展开 ， 再 编 详 成 机 右 指 令 。 因 此 ， 在 编 详 期 间 ， 上 面 那 条 moyv 指令 将 被 
展开 为 下 面 的 形式 : 


moOV bvte [Oxb8000t0x021, "hh" 


宏 可 以 定义 成 任何 形式 ， 只 要 你 党 得 方便 。 因 此 ， 下 和 面 义 是 为 一 种 
定义 宏和 使 用 宏 的 例子 : 


sdefine vrm(x) byte [0xb8000+X] 


[bats 32| 


mov vrm(ebx);: hh 


在 编 详 阶段 ， 这 最 后 一 条 mov 指令 编译 时 ， 将 先 锐 展开 成 如 下 的 形 
式 : 


mov bvte [Oxb8000tebx|ls hnh’ 


注意 ， 宏 定义 不 占用 程序 的 地 址 空间 ， 它 只 是 一 种 简化 程序 编写 过 
程 的 手段 ， 仅 在 编译 之 前 有 用 ， 在 编译 之 后 ， 安 就 消失 了 。 

除了 单行 的 宏 ， 多 行 的 宏 可 能 用 处 更 大 。 和 定义 多 行 的 宏 应 当 使 用 天 
键 字 %macro。 多 行 宏 的 形式 是 


smacro 宏 名 字 参数 个 数 
… : 〈 宏 的 具体 内 容 ) 


senaqmacro 
从 个 例子 ， 假 如 有 以 下 定义 宏和 使 用 宏 的 代码 : 
TT 


push ebp 

mov ebp,esp 

SuB ESD 1 

add dword [0x2000] ,$2 


endmacereo 


[BYESs 32| 
dostack 8,0x55aa 


注意 ， 在 定义 宏 的 时 候 ， 宏 名 字 后 面 只 给 出 了 参数 个 数 ， 在 宏 体 内 
使 用 参数 时 ， 第 1 个 参数 是 %1， 第 2 个 参数 是 %2， 依 此 类 推 。 因 此 ， 以 
上 代码 编 详 时 ， 最 后 一 条 语句 将 被 展开 成 如 下 的 形式 : 


push ebp 

mov ebp,esp 

sub esp,8 

add dword [0x2000] ,0x55aa 


回 到 代码 清单 17-2 中 来 。 


宏 alloc_core_ linear 是 在 第 12 行 定义 的 ， 有 共有 0 个 参数 ， 也 束 是 没 
有 有 参数。 该 宏 的 作用 是 在 内 核 的 虚拟 地 址 空间 上 分 配 内 和 存 ， 并 返回 起 始 
的 线性 地 址 。 下 一 个 可 分 配 的 线性 地 址 在 内 核 任务 的 TCB 中 。 因 此 ， 第 
13 行 ， 从 内 核 任 务 的 TCB 中 取得 该 地 址 。 


为 了 简单 起 见 ， 每 次 在 内 核 的 空间 中 分 配 内 存 时 ， 不 管 希 要 多 少 ， 
都 固定 地 分 配 一 个 页 〈 的 大 小 ) 。 因 此 ， 第 14 行 ， 将 TCB 中 的 那个 数值 
在 原来 的 基础 上 增加 4096 (0x1000) ， 这 就 是 下 一 个 可 分 配 的 线性 地 
址 。 


第 15 行 ， 调 用 过 程 alloc inst a_page 以 分 配 一 个 物理 页 ， 并 用 页 的 
物理 地 址 和 它 所 对 应 的 线性 地 址 去 修改 当前 内 核 任 务 的 页 目录 表 和 页 
表 。 

当然 ， 你 可 能 怀疑 在 这 里 使 用 宏 的 必要 性 。 事 实 上 ， 这 是 有 必要 
的 。 分 配 内 存 需 要 访问 TCB， 分 配 之 后 还 要 更 新 原来 的 数据 ， 以 形成 下 
一 个 可 分 配 的 线性 地 址 。 很 多 时 候 ， 由 于 一 时 马虎 ， 会 筷 了 更 新 那个 
数 ， 以 至 于 下 次 分 配 的 线性 地 址 还 和 上 一 次 相同 ， 这 就 是 致命 的 问题 。 
一 个 可 能 的 办 法 是 将 它 定 义 成 过 程 。 问 题 是 ， 事 情 很 简单 ， 用 过 程 调 用 
的 方法 来 做 代价 太 大 。 考 虑 再 三 ， 宏 是 最 好 的 选择 。 

当然 ， 不 能 滥用 宏 。 人 否则 ， 代 但 将 既 难 阅读 ， 又 难 维护 。 

为 内 核 TSS 分 配 的 线性 基地 址 在 EBX 寄存 器 中 。 第 1021 一 1026 
行 ， 初 始 化 TSS 中 的 静态 部 分 ， 包 括 CR3 寄存 器 域 〈 内 核 的 页 目录 表 物 
理 地 址 ) 、LDT 域 、TSS 反 回 链 、JO 位 映射 表 侦 移 量 等 。 


第 1029 一 1033 行 ， 创 建 内 核 任务 TSS 的 描述 从。 

第 1034 行 ， 将 过 程 set up _ gdt descriptor 返回 的 TSS 选择 子 保存 
到 内 核 任务 的 TCB 中 ， 将 来 在 任务 切换 时 要 用 到 。 

第 1038 行 ， 用 内 核 任 务 的 TSS 选择 子 加 载 任务 寄存 器 TR。 这 将 导 
致 处 理 器 将 指定 TSS 的 线性 基地 址 和 段 界限 值 加 载 到 TR 寄存 器 的 描述 符 


局 速 缓存 右 。 全 此 ， 内 核 任务 才 名 正言 顺 地 成 为 一 个 合法 的 任务 。 


17.5 ”用户 任务 的 创建 
17.5.1 ”准备 加 载 用 户 程序 


和 往 沼 一 样 ， 接 下 来 的 工作 是 加 载 用 望 程 序 ， 创 建 用 户 任 务 。 创 建 
和 撤销 任务 ， 是 内 核 任务 的 职责 所 在 。 为 此 ， 需 要 前 先 创建 用 户 任 务 的 
TCB。 我 们 知道 ， 为 了 能 够 访问 和 控制 所 有 的 任务 ， 每 个 任务 的 TCB 都 
必须 创建 在 内 核 的 地 址 空间 内 。 第 1043 行 ， 宏 alloc core linear 用 于 创 
建 用 己任 务 的 TCB。 

第 1045 一 1047 行 ， 初 始 化 用 户 任 务 的 TCB， 主 要 包括 初始 的 LDT 
界限 什 ， 以 及 从 哪个 线性 地 址 开始 在 用 户 任 务 的 局 部 空间 内 分 配 和 内存 
(一 般 是 0) 。 注 意 ， 任 务 的 状态 人 是 0x0000， 即 空闲 。 

第 1049 一 1051 行 ， 在 当前 栈 中 压 入 两 个 双 字 参数 ， 并 调用 
load_relocate_program 过 程 以 加 载 和 和 草 定 位 用 户 程 序 。 

过 程 load_relocate_ program 是 从 第 616 行 开始 的 。 

第 620 行 ， 保 存 栈 指针 寄存 器 ESP 的 快照 ， 为 访问 栈 内 的 参数 做 准 


备 。 在 第 16 盖 ， 这 条 指令 之 前 还 有 两 个 将 段 寄 存 磺 DS 和 ES 压 栈 的 指 
人 
xX: 


pushad 
isn ds 
push es 
mov ebp,esp ;为 访问 通过 栈 传递 的 参数 做 准备 


而 在 本 章 中 ， 内 核 和 用 户 任 务 都 工作 在 平坦 模型 下 ， 也 就 不 必 考 虑 
分 段 ， 上 段 寄 存 占 压 栈 的 指令 也 没有 了 ， 变 成 了 这 样 : 


pushad 
mov ebp,esp ; 为 访问 通过 栈 传递 的 参数 做 准备 


正 因 为 如 此 ， 栈 的 状态 也 和 上 一 章 有 所 不 同 。 如 图 17-18 所 示 ， 第 一 
个 参数 的 位 置 是 SS:EBP+40; 第 二 个 参数 的 位 置 是 SS:EBP+36。 


高 字 低 字 


<— SS: EBP+40 
< S93: EBP+36 


8 个 双 字 (通用 寄存 器 ) 
栈 推进 方向 
<— SS: EBP 


图 17- | 执行 mov ebp,esp 时 lit 


这 这 本 来 是 个 该 成 为 一 个 问题 的 。 想 想 看 ， 要 是 当初 把 mov ebp,esp 
指令 放 在 pushad 指令 之 后 ， 两 个 将 段 守 存 如 压 栈 的 指令 之 前 ， 束 不 至 于 
在 本 章 中 做 这 样 的 修改 工作 了 ， 


17.5.2 ”转换 后 援 缓 冲 占 的 刷新 


第 625 一 631 行 ， 清 衬 当 前 页 目录 表 的 前 六部 分 ， 为 创建 用 户 任务 的 
页 表 目 录 项 做 准备 。 在 第 16 章 里 已 经 说 清楚 了， 我 们 是 借用 内 核 的 页 目 
录 来 创建 用 户 任务 的 页 目录 ， 毕 葛 ， 对 于 每 一 个 任务 来 说 ， 页 目录 表 的 
有 前半 部 分 对 应 看 它 的 局 部 空间 ， 后 半 部 分 对 应 看 全 局 空间 ， 内 核 用 有 的 古 
其 页 目录 表 的 后 半 部 分 ， 前 半 部 可 以 临时 用 来 创建 只 属于 任务 目 己 的 页 
目录 项 。 

第 633、634 行 ， 重 新 加 载 一 过 控制 寄存 器 CR3“〈 页 目录 表 基 地 址 寄 
存 器 PDBR ) 。 显 然 ， 这 是 用 CR3 原 有 的 内 容 再 次 加 载 一 过， 来 回 一 样 
远 ， 这 有 什么 用 呢 ? 

开 司 页 功能 时 ， 处 理 需 的 页 部 件 要 把 线性 地 址 转换 成 物理 地 址 ， 而 
访问 页 目录 表 和 页 表 是 相当 费时 间 的 。 因 此 ， 把 页 表 项 预先 存放 到 处 理 
器 中 ， 可 以 加 快 地 址 转换 速度 。 为 此 ， 处 理 器 专门 构造 了 一 个 特殊 的 高 
速 绥 存 装 置 ， 叫 做 转换 后 援 缓冲 器 (Translation Lookaside Buffer， 





TLB) 。 事 实 上 ， 对 该 缓 神 邢 的 命名 可 谓 五 化 人 门 ， 从 "转换 劳 路 绥 神 
人 蚀 ”、“ 转 换 后 备 缓冲 区 ”到 “ 快 表 ， 不 一 而 中 。 

如 图 17-19 所 示 ， 这 是 TLB 的 结构 。 它 分 为 两 大 部 分 ， 第 一 部 分 十 
标记 ， 其 内 容 为 线性 地 址 的 局 20 位 ;第 二 部 分 十 页 表 数 据 ， 包 括 属 性 、 
访问 权 和 页 物理 地 址 的 高 20 位 。 在 分 页 檬 式 下 ， 妆 有 段 部 件 友 出 一 个 线性 
地 址 时 ， 处 理 占 用 线性 地 址 的 高 20 位 来 查找 TLB， 如 条 找到 匹配 项 《〈 命 
中 ) ， 则 直接 使 用 其 数据 部 分 的 物理 地 址 作为 转换 用 的 地 址 ;如 果 检 索 
不 成 功 ( 不 中 ) ， 则 处 理 器 还 得 花 时 间 访 问 内 存 中 的 页 目录 表 和 页 表 ， 
找到 那个 页 表 项 ， 然 后 将 它 填写 到 TLB 中 ， 以 备 后 用 。TLB 容量 不 大 ， 
如 琳 它 冯 满 了 ， 则 必须 淘汰 挥 那 些 用 得 较 少 的 项 目 。 


线性 地 址 的 位 31 一 12《 页 号 ) 访问 权 和 属性 页 物理 地 址 的 位 31 一 12 
线性 地 址 的 位 31 一 12〈 页 号 ) 访问 权 和 属性 页 物理 地 址 的 位 31 一 12 





线性 地 址 的 位 31 一 12《 页 号 ) 访问 权 和 属性 页 物理 地 址 的 位 31 一 12 


标记 页 表 数据 
图 17-19 ”转换 后 援 缓冲 器 (TLB) 的 结构 


TLB 中 的 属性 位 来 自 页 表 项 ， 比 如 页 表 项 中 的 D 位 〈 脏 位 ) 等 ; 访 
问 权 位 来 上 自 页 目录 项 和 对 应 的 页 表 项 ， 比 如 RW 位 和 US 位 ， 等 等 。 问 题 
是 ， 束 RW 位 和 US 位 来 说 ， 页 目录 项 和 页 表 项 都 有 这 两 位 ， 以 哪 一 个 为 
准 呢 ? 在 分 页 机 制 中 ， 对 页 的 访问 控制 按 最 严格 的 访问 权 执 行 。 对 于 某 
个 线性 地 址 ， 如 果 其 页 目录 项 的 RW 位 是 “0” 而 其 页 表 项 的 RW 位 是 “1”， 
则 按 RW 位 是 “0” 执 行 。 也 就 是 说 ，TLB 中 的 访问 权 ， 是 页 目录 项 和 页 表 
项 中 ， 对 应 访问 权 的 逻辑 与 。 


处 理 吉 仅 仅 绥 存 那些 P 位 是 “人 的 页 表 项 ， 而 且 ，TLB 的 工作 和 CR3 
寄存 器 的 PCD 和 PWT 位 无 关 ， 不 受 这 两 位 的 影响 。 另 外 ， 对 于 页 表 项 
的 修改 不 会 同时 反映 到 TLB 中 。 是 的 ， 这 是 很 糟糕 的 ， 如 果 内 存 中 的 页 
表 项 已 经 修改 ， 但 TLB 中 的 对 应 条 目 还 没有 更 新 ， 那 么 ， 转 换 后 的 物理 
地 址 必定 是 错误 的 。 


记得 第 一 次 在 分 页 模式 下 写 程 序 时 ， 我 遇 到 过 这 个 问题 。 因 为 没有 
更 新 TLB， 程 序 总 是 出 钳 ， 总 是 产生 异 帅 〈 对 这 件 事 ， 网 友 周 卫 平 应 该 是 
记得 的 ) 。 在 用 bochs 软件 单 步 跟踪 程序 的 执行 时 ， 发 现 页 目录 项 对 应 
的 页 表 项 并 不 是 我 刚刚 设置 的 。 尽 管 你 知道 TLB， 也 知道 它 的 原理 ， 但 
是 ， 很 多 时 候 ， 也 许 只 有 在 人 花 了 几 天 工夫 ， 效 了 几 夜 之 后 ， 你 才 终于 发 
现 问 题 出 在 一 个 你 明白 ， 但 却 忽略 了 的 地 方 。 在 第 16 章 里 ， 只 创建 了 一 
个 用 户 任务 ， 过 程 load_relocate program 只 被 调用 了 一 次 ， 不 会 有 什么 
问题 。 在 本 章 里 ， 起 码 创 建 了 两 个 用 户 任 务 ， 如 果 不 刷 新 TLB， 是 不 行 
的 。 


TLB 是 软件 不 可 直接 访问 的 ， 但 却 有 其 他 办 法 来 刷新 它 的 内 容 (条 
目 ) 。 比 如 ， 将 CR3 寄存 器 的 内 容 读 出 ， 再 原样 写 入 ， 这 样 就 会 使 得 
TLB 中 的 所 有 条 目 失 效 。 当 然 ， 这 是 比较 直接 的 做 法 。 当 任务 切换 时 ， 
因为 要 从 新 任务 中 的 CR3 寄存 器 域 加 载 页 目录 表 基 地 址 ， 也 会 隐 式 地 导 
致 TLB 中 的 所 有 条 目 无 效 。 


注意 ， 上 述 方 法 对 于 那些 标记 为 全 局 (G 位 为 “1*) 的 页 表 项 来 说 无 
效 ， 不 起 作用 。 


17.5.3 用户 任务 的 创建 和 初始 化 


从 第 637 行 开 始 ， 到 第 760 行 ， 这 部 分 代码 用 于 从 硬盘 上 加 载 用 户 
程序 ， 并 在 LDT 内 创建 各 个 段 的 描述 符 。 总 体 上 上 ， 它 们 和 第 16 章 相 同 ， 
只 有 三 点 需要 说 明 。 

Q) 这 段 代 码 工 作 在 平坦 模式 下 ， 因 此 没有 出 现任 何 加 载 段 寄存 器 和 
使 用 上 段 超越 前 级 的 指令 。 和 用 户 任 务 有 关 的 操作 在 虚拟 地 址 空间 的 低 端 
(CO0x00000000 一 0x7FFFFFFF) 进行 ， 和 内 核 有 关 的 操作 在 虚拟 地 址 空 
间 的 高 端 〈0x80000000 一 0xFFFFFFFF ) 进行 。 


@) 在 用 户 任 务 的 局 部 地 址 空间 分 配 内 存 时 ， 用 的 是 安 
alloc_user_linear。 该 宏 是 在 第 18 行 定 义 的 。 


(3) 过 程 read_hard disk_ 0 有 所 修改 ， 主 要 是 在 首尾 各 增加 了 指令 cli 
和 sti。 在 读 硬盘 时 ， 应 当 屏 蔽 硬件 中 断 ， 以 防止 对 同一 个 人 硬盘 控制 器 站 
口 的 交叉 修改 ， 这 会 产生 很 严重 的 问题 。 特 别 是 在 多 任务 环境 下 ， 当 一 
个 任务 正在 读 硬 盘 时 ， 会 被 另 一 个 任务 打 断 。 如 果 另 一 个 任务 也 访问 硬 
盘 ， 将 破坏 前 一 个 任务 对 硬盘 的 操作 状态 。 


第 763 一 798 行 ， 重 定位 U-SALT 表 。 这 部 分 代码 和 第 16 章 相 比 ， 绝 
大 多 数 是 相同 的 ， 但 也 有 差异 。 首 先 ， 去 掉 了 一 些 指 令 ， 主 要 是 那些 加 
载 段 寄存 器 的 指令 ， 比 如 在 第 16 章 中 有 如 下 指令 : 


mov eax,mem 0 4 gb seg sel ;访问 任务 的 4GB 虚拟 地 址 空间 时 用 


mOV es,eax 


mov onx corerdata segqnsel 


mov ds,eax 


在 本 章 中 ， 这 些 指令 已 经 删除 ， 因 为 内 核 和 用 户 程序 都 工作 在 平坦 
模式 下 。 
其 次 ， 同 样 的 指令 ， 在 第 16 重 中 的 含义 和 本 章 不 同 。 比 如 : 


mov esi,salt 


这 条 指令 用 于 获取 内 核 SALT 表 (C-SALT ) 的 地 址 。 如 图 17- 
20 (a) 所 示 ， 在 第 16 章 中 ， 内 核 工 作 在 多 段 模型 ， 因 此 ，ESI 寄存 器 
中 的 内 容 是 C-SALT 表 在 内 核 数 据 段 内 有 的 仿 移 量 。 如 图 17-20 (b) 所 示 ， 
在 本 章 中 ， 由 于 内 核 工作 在 平坦 模式 ， 因 此 ，ESI 寄存 器 中 的 内 容 是 C- 
SALT 表 在 整个 4GB 段 内 的 线性 地 址 。 


则 第 16 章 相 比 ， 用 户 程 序 的 基本 结构 没有 变化 。 用 户 程 序 是 从 其 虚 
拟 地 址 空间 的 开始 处 (0x00000000) 加 载 的 ， 偏 移 量 为 0x0000000C 和 
0x00000008 的 地 方 分 别 是 U-SALT 表 的 条 目 数 及 其 线性 地 址 。 第 765、 
766 行 用 于 获取 这 两 个 数值 。 

第 801 一 807 行 ， 创 建 LDT 描述 符 ， 并 安装 到 GDT 中 。 

第 809 一 824 行 ， 用 前 面 的 工作 成 果 来 填写 任务 状态 段 (TSS) 。 

第 827 一 832 行 ， 创 建 TSS 描述 符 ， 并 安装 到 GDT 中 。 

第 836 一 838 行 ， 当 前 页 目录 表 只 是 借用 的 ， 它 属于 内 核 。 用户 任 务 
必须 有 上 自己 的 页 目录 表 。 为 此 ， 申 请 一 个 空闲 页 作为 用 户 任务 的 页 目录 
表 ， 并 将 当前 页 目录 表 的 内 容 复制 过 去 。 

具体 的 复制 工作 是 由 过 程 create copy_cur _pdir 来 完成 的 ， 该 过 程 
是 从 第 381 开始 的 。 和 第 16 章 相 比 ， 多 加 了 一 条 指令 ， 即 ， 第 394 行 的 
invlpg 指令 (Invalidate TLB Entry) 。 


FFFFFFFF 


内 核 代码 段 


内 核 数据 段 
公共 例 程 段 


人 ES S A L r Tr 由 > 5002 vo co S02 ote 


CS、SS、 DS、 


4GB 数 据 段 80000000 Ha a Ge 





U S A TE -> (99e90900090909000005000900000000000500092000000000000005090090909| 


U-SALT-> PY 
00000000 


(a)》 前 一 章 中 的 视图 (b) 本 章 中 的 视图 


图 17-20”U-SALT 和 C-SALT 在 两 种 内 存 模型 下 的 布局 视图 


和 刷新 整个 TLB 不 同 ，invlpg 指令 用 于 刷新 TLB 中 的 单个 条 目 。 当 
然 ， 要 做 到 这 一 点 ， 必 须 指定 一 个 线性 地 址 ， 处 理 器 用 给 出 的 线性 地 址 
搜索 TLB， 找 到 那个 条 目 ， 然 后 从 内 存 中 重新 加 载 它 。invlpg 指令 的 格式 
为 


In 站 


也 束 是 说 ,该 指令 的 操作 数 是 一 个 内 存 地 址 。 指 令 执 行 时 ， 处 理 右 
自 完 确 定 该 线性 地 址 位 于 哪个 页 内 ， 然 后 刷新 相应 的 TLB 条 目 。 你 可 能 
会 问 ， 为 什么 它 不 接受 一 个 立即 数 ， 像 这 样 : 


人 
而 非得 是 
invipg [OxEFEffEfEEES) 
我 们 知道 ，TLB 是 一 个 附加 的 便 件 机 构 ， 只 有 在 处 理 问 正常 访问 内 


存 时 才 会 导致 它 的 填充 和 更 新 。 因 此 ， 处 理 器 用 一 个 访问 内 存 的 操作 来 
促使 TLB 条 目的 更 新 会 更 方便 。 


0xFFFFFFF8 是 当前 《内 核 ) 页 目录 表 内 的 倒数 第 2 个 目录 项 ， 每 
次 都 用 它 来 指向 新 任务 的 页 目录 表 。 当 任务 A 创建 完毕 后 ， 它 指向 任务 A 
的 页 目录 表 ; 当 任 务 B 创建 时 ， 它 依然 指 问 任务 A 的 页 目录 表 。 虽 然 在 第 
392 行 改写 了 它 ， 使 它 指 同 新 任务 的 页 目录 表 ， 但 这 个 更 改 只 在 内 存 中 


有 效 ， 还 没有 反映 到 TLB 中 。 如 果 不 刷 新 TLB 中 的 这 个 条 目 ， 那 么 ， 后 
面 的 所 有 操作 ， 都 是 针对 前 一 个 任务 的 页 目录 表 进 行 的 ， 这 了 束 肪 烦 了 。 
是 的 ， 我 遇 到 过 这 个 问题 。 

因此 ， 第 394 行 ， 用 invlpg 指令 来 明确 地 刷新 TLB 的 对 应 条 目 。 
invlpg 是 特权 指令 ， 在 保护 模式 下 执行 时 ， 当 前 特权 级 CPL 必须 为 0。 访 
指令 不 影响 任何 标志 位 。 


继续 回 到 过 程 Iload relocate program， 第 842 行 ， 弹 出 并 废弃 栈 中 
的 两 个 参数 ， 将 控制 转移 到 调用 者 。 


第 1052、1053 行 ， 将 刚刚 创建 的 那个 任务 的 TCB 附加 到 TCB 链 
| 


注意 ， 此 刻 ， 任 务 切 换 也 跟 看 开始 了 ! 在 此 之 前 ，TCB 链 上 只 有 一 
个 状态 为 忙 的 内 核 任务 ，0x70 号 中 断 虽 然 每 秒 产生 一 次 ， 但 不 会 有 任务 
切换 。 随 看 第 一 个 空 几 任务 的 加 入 ， 当 中 断 产 生 时 ， 会 切换 到 刚才 创建 
的 那个 用 户 任 务 去 执行 。 


用 户 程序 非常 简单 ， 基 本 框架 和 第 16 章 一 样 。 本 章 提 供 了 两 个 用 户 
程序 ， 分 别 对 应 着 代码 清单 17-3 和 17-4， 这 两 个 程序 执行 时 ， 分 别 对 应 
着 用 户 任 务 A 和 用 户 任务 B。 请 分 别 浏览 这 两 个 代码 清单 ， 你 会 发 现 它们 
基本 一 样 ， 唯 一 的 区 别 是 它们 在 屏幕 上 显示 的 内 容 。 任 务 A 的 功能 是 不 
停 地 在 屏幕 上 显示 


任务 B 则 显示 的 古 
User task B->$3$$$$$399$9$$$53999$$55999S9$55555S 


第 1056 一 1066 行 ， 创 建 第 二 个 用 户 任务 。 访 任务 对 应 独 代 人 码 清单 
17-4， 在 虚拟 便签 上 的 起 始 馆 辑 而 区 号 为 100。 当 该 任务 创建 完毕 ， 并 加 
入 TCB 链 后 ， 系 统 束 会 开始 三 个 任务 之 则 的 切换 。 

第 1068 一 1074 行 是 内 核 任 务 的 主体 ， 是 反复 执行 的 部 分 。 它 不 做 别 
的 ， 就 是 在 每 次 得 到 处 理 器 控制 权时 ， 反 复 显示 相同 的 信息 “System 
core task running!”"。 理 论 上 ， 作 为 任务 的 官 理 者 ， 这 里 应 该 还 有 终止 用 
户 任 务 ， 并 回收 内 存 空间 的 代码 。 人 简单 起 抑 ， 这 里 予以 省 略 ， 留 给 谈 者 
进行 。 


17.6 程序 的 编译 和 执行 


分 别 编译 本 章 捉 供 的 4 个 代码 清 单 ， 并 生成 相应 的 BIN 文件 。 


将 文件 c17_ mbrbin 写 入 虚拟 人 硬盘 的 逻辑 0 鹿 区 ， 从 逻辑 1 书 区 开始 
写 入 文件 c17_core.bin， 从 逻辑 50 局 区 开始 写 入 c17 1.bin; 从 逻辑 100 
而 区 开始 写 入 c17_2.bin。 


局 动 虚拟 机 ， 正 第 情况 下 ， 程 序 的 运行 结 来 与 图 17-21 类 似 ，。 


LEARN-ASM [正在 运行 ] - Oracle VM VirtualBox [二 | 回 区 | 
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图 17-21 本 章程 序 的 运行 结 来 


本 章 习 题 


1. 下 和 邯 一 人 下， 在 没有 刷新 TLB 的 情况 下 ， 为 什么 第 二 放 调 用 


load relocate program 过 程 时 会 出 现 错误 ? 


2. 本 章 中 的 用 户 任务 比较 简单 。 结 合 你 学 过 的 数学 知识 ， 修 改 本 章 
中 的 两 个 用 己任 务 ， 使 之 完成 比较 复杂 的 数学 运算 ， 比 如 计算 圆周 率 。 


3. 在 平坦 模型 下 ， 用 户 程 序 不 能 依靠 段 来 实现 目 由 浮动 。 如 有 果 可 能 
的 话 ， 想 办 法 解决 这 一 问题 。 提 示 : 一 般 来 说 ， 影 响 地 址 浮动 的 因素 只 
和 标号 有 关 。 

4. 在 流行 的 操作 系统 中 ， 一 般 不 用 处 理 需 固件 实现 任务 切换 ， 因 为 
这 种 方法 代价 较 高 。 如 果 可 能 的 话 ， 想 办 法 采用 软件 的 方法 代替 硬件 实 
现任 务 切换 。 
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附录 开本 书 用 四 图 表 及 其 页 


8086 通 用 寄 仔 示 意 
图 16 

ASCII 
表 .4 
i. 50 

VGA 文 本 模 式 的 显 示 属 竹 
表 . 51 

条 件 转 移 指令 及 其 判断 条 件 汇 总 
0 91 

便 控 制 器 端口 0x1f6 各 位 的 含 
RAR 126 

便 控 制 器 端口 0x1f7 各 位 的 含 
AAA 127 

逻 辑 右 移 示 意 
图 
i 136 

循 环 右 移 示 意 
图 
i 137 

8259 必 厂 级 联 未 意 
图 
151 


实 模式 下 的 中断 问 量 表 内存 布局 


CMOS RAM 中 的 时 则 信 上 晨 及 其 偏 移 


量 154 

CMOS RAM 的 寄存 器 ( ABCD ) 功能 详 
解 . 155 

x86 的 16/32 位 通 用 寄 存 如 示 总 
必 Go 170 

32 位 处 理 器 的 指令 指针 、 标 志和 段 寄 存 器 示意 
人 171 

闹 水 线 基 本 原 理 不 是 
9 CO 
174 

16 位 寻 址 方 式 不 意 
OO 
178 

32 位 寻 址 7 式 示 意 
区 
179 

全 局 朱 述 从 表 富 存 右 GDTR 的 组 
ee 186 

存 储 的 段 摘 述 从 格 
式 
188 

代 码 段 和 数据 段 摘 述 和 人 符 的 TYPE 这 
Og 190 

32 位 处 理 器 的 段 存 
0 196 

段 1 择 的 组 
成 


各 种 指令 重复 前 级 的 检 查 条 


a 240 

32 位 的 任 务 状 态 段 
TS 
248 

调 用 门 摘 述 从 的 格 
TO 
259 

LDT 摘 述 从 的 格 
式 

D72 

IO 许 可 位 映 奈 示 意 
OO 
274 

TSS 接 述 从 的 格 
人 

.277 

LDTR 和 TR 寄 存 到 的 组 
卫生 282 

任 务 门 摘 述 从 的 格 
式 
290 

EFLAGS 寄 存 对 的 组 
RE 
291 

任 务 巩 父 示 意 
OR 
py 292 


不 同 任 务 切 换 方 法 对 B 位、NT 位 和 任务 链接 域 的 影 


人 311 

控 制 寄 存 器 CR3 ( PDBR ) 的 ”组 
ee 313 

控 制 寄 存 器 CRO 的 PE 位 和 PG 
0 314 

保护 模式 下 的 中 断 和 异常 向 量 分 
0 342 

中 断 门 和 ” 陷 阱 门 摘 述 和 从 的 格 
oS——— 344 

中 汤 摘 述 和 从 表 寄存 名 IDTR 的 组 
00 344 


